📖 定义
Chain-of-Thought(CoT,思维链推理)是一种提示工程技术,通过引导语言模型在给出最终答案之前,先展示完整的推理过程和中间步骤,从而显著提升模型在数学推理、逻辑推理和复杂问题解决上的表现。
核心理念:不要让模型直接跳到答案,而是让它像人类一样"展示解题过程"。
⚙️ 工作原理
CoT 通过以下方式提升推理能力:
1
问题分解
将复杂问题拆解为多个简单子问题
→
2
逐步推理
按顺序解决每个子问题,记录中间结果
→
3
答案综合
基于所有中间步骤得出最终答案
💻 示例对比
❌ 普通提示(无CoT)
问题:小明有5个苹果,给了小红3个,又买了2个,现在有几个?
直接回答:小明现在有4个苹果。
# 问题:模型可能直接猜答案,容易出错
✅ CoT 提示
问题:小明有5个苹果,给了小红3个,又买了2个,现在有几个?
让我们一步步思考:
1. 小明最初有 5 个苹果
2. 给了小红 3 个后,还剩 5 - 3 = 2 个
3. 又买了 2 个,现在有 2 + 2 = 4 个
答案:小明现在有 4 个苹果。
# 思维链让推理过程可追溯、可验证
🔥 Zero-shot CoT(零样本思维链)
问题:一个商店进了100件商品,第一天卖出30%,第二天卖出剩余的40%,还剩多少?
提示:让我们一步步思考(Let's think step by step)
模型的回答:
- 商店有 100 件商品
- 第一天卖出 30%,即 100 × 0.3 = 30 件,剩余 100 - 30 = 70 件
- 第二天卖出剩余的 40%,即 70 × 0.4 = 28 件
- 剩余商品 = 70 - 28 = 42 件
答案:还剩 42 件商品。
🎯 适用场景
数学问题
多步骤计算、应用题、代数问题
逻辑推理
逻辑谜题、条件推理、因果关系
复杂决策
多因素权衡、方案比较
代码生成
算法设计、复杂编程任务
📚 CoT 变体技术
Few-shot CoT
提供几个带思维链的示例,让模型模仿推理模式
Self-Consistency CoT
多次采样不同推理路径,投票选择最一致答案
Tree of Thoughts (ToT)
将推理组织成树状结构,支持回溯和分支探索
Least-to-Most Prompting
从最简单子问题开始,逐步解决更复杂问题
Automatic CoT
自动生成思维链示例,无需人工标注
⚠️ 注意事项
- 模型规模依赖:小模型(<10B参数)CoT效果有限,大模型效果更好
- 推理成本:生成更多token意味着更高的计算成本和延迟
- 不是万能:对于简单问题反而增加冗余,应根据问题复杂度选择
- 错误传播:中间步骤的错误可能导致最终答案错误
🛠️ 实践技巧
触发短语
"让我们一步步思考"、"Think step by step"
格式引导
使用"分析:"、"步骤:"等标签引导结构化输出
验证步骤
添加"让我们验证答案"步骤检查结果
Few-shot示例
提供2-3个高质量思维链示例