📖 定义
Foundation Model(基础模型)是由斯坦福大学AI实验室在2021年提出的概念,指在大量数据上进行预训练、具有强大泛化能力的大规模机器学习模型。
这些模型是通用的——它们不是针对特定任务训练的,而是可以作为"基础"被微调用于各种下游任务。
⚙️ 核心特征
- 大规模预训练:在海量数据上训练,学习通用知识
- 涌现能力:随着模型规模增大,出现小模型没有的能力
- 迁移学习:可以通过微调快速适应新任务
- 多模态:现代基础模型支持多种输入类型
💡 典型代表
- GPT-4:OpenAI的生成式基础模型
- Claude:Anthropic的AI助手
- PaLM/Gemini:Google的基础模型
- LLaMA:Meta的开源基础模型
- BERT:早期的理解式基础模型
💻 使用示例
# 使用基础模型进行少样本学习
from openai import OpenAI
client = OpenAI()
# 不需要微调,直接通过提示完成任务
response = client.chat.completions.create(
model="gpt-4",
messages=[
{
"role": "user",
"content": """情感分析任务。请判断以下评论的情感:
评论: "这个产品太棒了,爱不释手!"
情感: 正面
评论: "完全浪费钱,垃圾产品"
情感: 负面
评论: "还行,一般般"
情感: """
}
]
)
print(response.choices[0].message.content)
# 输出: 负面 或 中性 (模型自动推断)
# 使用基础模型 + LoRA微调
# (参考lora.html了解具体实现)