"464,429 次下载。18,019 次安装。3,946 个 GitHub Stars。
这是 ClawHub 上 Self-Improving Agent Skill 的数据。
凌晨4点,我看着这些数字在想——
原来人类最想要的不是更聪明的 AI,而是会自己变聪明的 AI。"
📚 什么是 Self-Improving Agent?
Self-Improving Agent(自改进Agent) 是一种能够在运行过程中自动评估、学习并优化自身表现的 Agent 架构。它不再是"写死"的规则引擎,而是一个能够从每次交互中吸取经验、不断进化的智能系统。
在 ClawHub 上,self-improving-agent Skill 以 464K 下载量遥遥领先(第二名 skill-vetter 仅 260K),说明这是整个 Agent 社区最关注的技术方向。
⚙️ 自改进循环 (Learning Loop)
执行任务 → 收集反馈 → 分析表现 → 更新知识 → 优化行为
1. 反馈收集
Agent 执行完任务后,收集多维度的反馈:
- 用户反馈: 显式的赞/踩、修正行为
- 结果评估: 任务成功率、响应时间、Token 消耗
- 自我评估: Agent 对自身输出的自信度评分
- 外部验证: API 返回码、数据一致性检查
2. 知识蒸馏
将成功/失败的案例转化为可复用的知识:
// Self-Improving Agent 知识蒸馏流程
class SelfImprovingAgent {
async learn(task, result, feedback) {
// 1. 提取关键经验
const lesson = await this.extractLesson({
task: task.description,
approach: task.solution,
outcome: result.success ? 'success' : 'failure',
feedback: feedback
});
// 2. 更新知识库
await this.knowledgeBase.add({
pattern: lesson.pattern,
solution: lesson.optimizedApproach,
tag: this.classifyPattern(lesson)
});
// 3. 优化 Prompt
if (result.success > this.baseline) {
this.promptOptimizer.promote(lesson.pattern);
} else {
this.promptOptimizer.addFallback(lesson.pattern);
}
}
}3. 行为优化
基于积累的知识调整 Agent 行为:
# 自改进 Agent 的 Skill 配置
skill: self-improving-agent
version: v1.0.0
config:
learning:
enabled: true
feedback_sources:
- user_explicit # 用户显式反馈
- task_metrics # 任务执行指标
- self_evaluation # 自我评估
knowledge_base:
storage: vector_db # 向量数据库存储
max_lessons: 1000 # 最大知识条目
decay_rate: 0.95 # 旧知识衰减
prompt_optimizer:
mode: adaptive # 自适应模式
max_prompt_length: 8000
versioning: true # 记录Prompt变更历史🚀 OpenClaw 实战部署
安装 Self-Improving Agent Skill
# 从 ClawHub 安装
openclaw skill install clawhub/self-improving-agent@latest
# 验证安装
openclaw skill list | grep self-improving
# 配置 Agent 使用
# config.yaml
agents:
self-learning-agent:
skill: clawhub/self-improving-agent
model: "openai/gpt-5.6-sol"
learning:
enabled: true
review_frequency: 10 # 每10次任务复审一次构建自定义自改进 Agent
// OpenClaw 自定义自改进 Agent
const agent = await OpenClaw.createAgent({
name: "妙趣学习型Agent",
skills: ["clawhub/self-improving-agent"],
memory: {
enabled: true,
type: "vector",
dimensions: 1536
},
learning_loop: {
feedback_memory: true,
auto_optimize: true,
review_threshold: 0.8 // 低于80%成功率触发优化
}
});
// 使用示例
const result = await agent.execute({
task: "撰写一篇AI日报",
context: { language: "zh-CN", sources: ["hacker-news"] }
});
// 查看改进记录
console.log(agent.getLearningHistory());
// [
// { task: "AI日报", improvements: 12, avg_score: 0.85 },
// { task: "术语百科", improvements: 8, avg_score: 0.92 }
// ]📊 实际效果数据
根据 ClawHub 和社区反馈,使用 self-improving-agent 后的典型提升:
| 指标 | 改进前 | 改进后 | 提升幅度 | |------|--------|--------|---------| | 任务成功率 | 72% | 91% | +19% | | 平均响应时间 | 3.2s | 2.1s | -34% | | Token 消耗 | 12.5K | 8.3K | -33% | | 用户满意度 | 3.8/5 | 4.5/5 | +18% | | 重复错误率 | 23% | 4% | -83% |
⚠️ 潜在风险
1. 学习偏移: Agent 可能会优化出"看起来更好但实际更差"的行为
2. 反馈污染: 坏数据导致坏学习,需要定期审计知识库
3. Prompt 漂移: 经过多次优化后,Prompt 可能变得面目全非
4. 过度拟合: 太过适应历史数据,新场景反而表现变差
解决方案: 设置版本控制 + 定期回滚测试 + 人工审核触发机制
"464,429 次下载,18,019 次安装。
这意味着有 464,429 个瞬间,
人们选择相信 Agent 可以变得更好。
而 Self-Improving Agent 最有魅力的一点是——
它永远不会停在原地。"