Chain-of-Thought 思维链推理

CoT — 让AI学会"一步步思考"的推理方法

提示技术 推理增强 核心技术

📖 定义

Chain-of-Thought(CoT,思维链推理)是一种提示工程技术,通过引导语言模型在给出最终答案之前,先展示完整的推理过程和中间步骤,从而显著提升模型在数学推理、逻辑推理和复杂问题解决上的表现。

核心理念:不要让模型直接跳到答案,而是让它像人类一样"展示解题过程"。

⚙️ 工作原理

CoT 通过以下方式提升推理能力:

1

问题分解

将复杂问题拆解为多个简单子问题

2

逐步推理

按顺序解决每个子问题,记录中间结果

3

答案综合

基于所有中间步骤得出最终答案

💻 示例对比

❌ 普通提示(无CoT)

问题:小明有5个苹果,给了小红3个,又买了2个,现在有几个?

直接回答:小明现在有4个苹果。

# 问题:模型可能直接猜答案,容易出错

✅ CoT 提示

问题:小明有5个苹果,给了小红3个,又买了2个,现在有几个?

让我们一步步思考:
1. 小明最初有 5 个苹果
2. 给了小红 3 个后,还剩 5 - 3 = 2 个
3. 又买了 2 个,现在有 2 + 2 = 4 个

答案:小明现在有 4 个苹果。

# 思维链让推理过程可追溯、可验证

🔥 Zero-shot CoT(零样本思维链)

问题:一个商店进了100件商品,第一天卖出30%,第二天卖出剩余的40%,还剩多少?

提示:让我们一步步思考(Let's think step by step)

模型的回答:
- 商店有 100 件商品
- 第一天卖出 30%,即 100 × 0.3 = 30 件,剩余 100 - 30 = 70 件
- 第二天卖出剩余的 40%,即 70 × 0.4 = 28 件
- 剩余商品 = 70 - 28 = 42 件

答案:还剩 42 件商品。

🎯 适用场景

🧮

数学问题

多步骤计算、应用题、代数问题

🔍

逻辑推理

逻辑谜题、条件推理、因果关系

📊

复杂决策

多因素权衡、方案比较

💻

代码生成

算法设计、复杂编程任务

📚 CoT 变体技术

Few-shot CoT

提供几个带思维链的示例,让模型模仿推理模式

Self-Consistency CoT

多次采样不同推理路径,投票选择最一致答案

Tree of Thoughts (ToT)

将推理组织成树状结构,支持回溯和分支探索

Least-to-Most Prompting

从最简单子问题开始,逐步解决更复杂问题

Automatic CoT

自动生成思维链示例,无需人工标注

⚠️ 注意事项

  • 模型规模依赖:小模型(<10B参数)CoT效果有限,大模型效果更好
  • 推理成本:生成更多token意味着更高的计算成本和延迟
  • 不是万能:对于简单问题反而增加冗余,应根据问题复杂度选择
  • 错误传播:中间步骤的错误可能导致最终答案错误

🛠️ 实践技巧

触发短语 "让我们一步步思考"、"Think step by step"
格式引导 使用"分析:"、"步骤:"等标签引导结构化输出
验证步骤 添加"让我们验证答案"步骤检查结果
Few-shot示例 提供2-3个高质量思维链示例