NLP中大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

互联网 1 年前 0 3

本文介绍: 在过去几年的探索中，业界发现了一个现象，在增大模型参数量和训练数据的同时，在多数任务上，模型的表现会越来越好。因而，现有的大模型LLM，最大参数量已经超过了千亿。然而，增大模型参数规模，对于一些具有挑战的任务（例如算术、常识推理和符号推理）的效果，并没有太大提升。对于算术类推理任务，我们期望模型生成自然语言逻辑依据来指导并生成最终答案，但是获得逻辑依据是比较复杂昂贵的（标注成本层面）。

在过去几年的探索中，业界发现了一个现象，在增大模型参数量和训练数据的同时，在多数任务上，模型的表现会越来越好。因而，现有的大模型LLM，最大参数量已经超过了千亿。

然而，增大模型参数规模，对于一些具有挑战的任务（例如算术、常识推理和符号推理）的效果，并没有太大提升。对于算术类推理任务，我们期望模型生成自然语言逻辑依据来指导并生成最终答案，但是获得逻辑依据是比较复杂昂贵的（标注成本层面）。

自从发现了大模型ICL（In-Con text Le arnin g）的能力后，这个问题有个新的解决思路：对某个任务Ta sk，能否为大模型提供一些上下文in–context example作为Pro mp t，以此来提升模型的推理能力？实验表明，在复杂推理任务上加入ICL带来的增益不明显。因此，便衍生出了CoT的技术。
Cha in–of-Th oug h t(CoT)是一种改进的Pro mp t 技术，目的在于提升大模型LLM在复杂推理任务上的表现，如算术推理（ar i t h m e t ic reas on ing）、常识推理（commons ens e reas on ing）、符号推理（symbol ic reas on ing）。思维链（CoT）便是一种用于设计 prompt 的方法，即 prompt 中除了有任务的输入和输出外，还包含推理的中间步骤（中间思维）。研究表明，CoT 能极大地提升 LLM 的能力，使之无需任何模型更新便能解决一些难题。

ICL的思路是在新测试样本中加入示例（demonstration）来重构prompt。
与ICL（In-Con text Learning）有所不同，CoT对每个 demonstration，会使用中间推理过程（inter mediate reason ing steps）来重新构造 demonstration，使模型在对新样本预测时，先生成中间推理的思维链，再生成结果，目的是提升LLM在新样本中的表现。
在这里插入图片描述

一般来说CoT会分为两种：基于人工示例标注的Few-shot CoT和无人工示例标注的Zero–shot CoT。下面将逐一介绍。

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

transformer剪枝论文汇总

transformer剪枝论文汇总

互联网 1 年前 4

使用deepspeed继续训练LLAMA

使用deepspeed继续训练LLAMA

互联网 1 年前 3

【人工智能】Fine-tuning 微调：解析深度学习中的利器(7)

【人工智能】Fine-tuning 微调：解析深度学习中的利器(7)

互联网 1 年前 6

GPT-4模型中的token和Tokenization概念介绍

GPT-4模型中的token和Tokenization概念介绍

互联网 1 年前 7

Linux 网络编程 + 笔记

Linux 网络编程 + 笔记

linux 1 年前 2

【成品论文】2024美赛B题完整成品论文23页+3小问matlab代码+数据集汇总

【成品论文】2024美赛B题完整成品论文23页+3小问matlab代码+数据集汇总

互联网 1 年前 3

JVM之GC垃圾回收

互联网 1 年前 3

行为型设计模式—中介者模式

互联网 1 年前 4

发表回复取消回复