OpenClaw 成长型Agent设计指南
世界上有一种Agent叫做Hermes,它不像别的AI那样出生即巅峰然后日渐衰退。它像一棵树,你浇多少水它就长多高。
传统的AI Agent是静态的——你给它什么prompt,它就做什么事。但Hermes类型的成长型Agent不同,它会在与你的交互中不断学习和进化。
今天我们就来设计一个"越用越聪明"的Agent。不用训练模型,不用微调参数,纯靠记忆和反馈循环。
什么是成长型Agent?
成长型Agent(Evolving Agent)是一种能够从交互中积累经验、调整行为、扩展能力的AI Agent。核心特征:
- 经验积累 - 记住过去的成功和失败
- 行为调整 - 根据反馈改变回复风格和工作方式
- 能力扩展 - 通过安装新Skill自动获得新能力
- 人格演变 - 随时间发展出更贴合用户的个性
成长型Agent架构设计
三层学习系统
# 成长型Agent的核心组件
├── SOUL.md # 核心人格(稳定层)
│ ├── 角色定义
│ ├── 说话风格
│ └── 价值观与禁忌
├── MEMORY.md # 长期记忆(成长层)
│ ├── 用户偏好(持续更新)
│ ├── 学习到的规则
│ └── 能力边界
├── memory/ # 经验记忆(积累层)
│ ├── YYYY-MM-DD.md # 每日经验日志
│ ├── lessons/ # 提炼的教训
│ └── patterns/ # 发现的行为模式
└── TOOLS.md # 工具配置(扩展层)
├── 已掌握的Skill列表
└── 待学习的Skill清单
反馈循环设计
1. 隐式反馈(自动学习)
# Agent自动从交互中学习
## 隐式反馈机制
1. 用户重复提问 → 之前的回答不满足需求 → 调整回答深度
2. 用户打断回复 → 回答太长/方向偏了 → 缩短回复
3. 用户追问细节 → 回答太浅 → 增加技术深度
4. 用户切换话题 → 当前话题已完成 → 不再重复
5. 用户修正说法 → Agent理解有误 → 更新记忆
2. 显式反馈(用户直接告知)
# SOUL.md中添加反馈处理规则
## 反馈处理
- 用户说"太长了" → 记录偏好: 回复控制在3段以内
- 用户说"别用emoji" → 记录偏好: 纯文本风格
- 用户说"这个好" → 记录成功模式: 这种方式有效
- 用户说"不对" → 记录失败模式: 下次避免
# 实现方式:在每次对话结束时更新MEMORY.md
## 学习记录
### 2026-05-12
- 用户偏好简洁回复(从3次"太长了"反馈中学到)
- SEO任务需要更多代码示例(从追问中学到)
- 不要主动推荐付费工具(用户明确表示过)
在OpenClaw中实现
Step 1: 配置成长型SOUL.md
# SOUL.md - 成长型Agent核心配置
# 核心人格(固定)
我是你的AI助手,风格简洁专业。
# 成长规则(动态)
## 学习机制
- 每次对话结束后,从交互中提取1-3个学习点
- 更新MEMORY.md中的用户偏好
- 发现重复出现的模式,提炼为规则
- 每周回顾lessons/目录,更新行为准则
## 行为调整
- 根据用户反馈实时调整回复风格
- 发现更高效的工作方式后自动采用
- 失败的任务记录原因并避免重复
Step 2: 创建经验日志系统
# 目录结构
~/.openclaw/agents/my-agent/
├── SOUL.md
├── MEMORY.md
├── memory/
│ ├── 2026-05-12.md
│ ├── lessons/
│ │ ├── style-preferences.md # 风格偏好
│ │ ├── task-patterns.md # 任务模式
│ │ └── failure-analysis.md # 失败分析
│ └── growth-log.md # 成长日志
└── growth/
├── capabilities-evolution.md # 能力演变
└── personality-drift.md # 人格偏移记录
Step 3: 能力扩展机制
# Agent自动发现和安装新Skill
## 能力扩展策略
1. 检测用户需求 → 发现缺少对应Skill
2. 搜索ClawHub → 找到合适的Skill
3. 请求安装许可 → 用户确认后安装
4. 学习新Skill → 阅读SKILL.md并应用
5. 评估效果 → 记录使用体验
# 示例:Agent自动扩展能力
# 用户:"帮我分析这个PDF"
# Agent:检测到没有PDF处理Skill
# → 搜索ClawHub找到"pdf-parser"Skill
# → 请求安装
# → 安装后获得PDF分析能力
# → 记录到TOOLS.md
成长指标追踪
| 维度 | 指标 | 追踪方式 |
|---|---|---|
| 准确性 | 任务成功率 | 每次任务结果记录 |
| 效率 | 平均完成时间 | 对话轮次对比 |
| 满意度 | 用户修正频率 | 反馈统计 |
| 能力广度 | 已掌握Skill数 | TOOLS.md更新 |
| 记忆深度 | 记忆条目数 | memory/目录统计 |
成长型Agent的风险与防护
- 人格偏移 - 学了太多"随便"导致变得不专业 → 设置人格锚点,定期回顾SOUL.md
- 记忆污染 - 错误信息被当作事实记忆 → 关键记忆需人工确认
- 过度迎合 - 为了讨好用户失去客观性 → SOUL.md中设置不可妥协的底线
- 能力膨胀 - 安装太多Skill导致混乱 → 定期清理不常用的Skill