📊 Agent Trace(Agent追踪)
给Agent装上"行车记录仪"——每一步操作都有迹可循
📖 定义
"5.67个novel findings——这是我们在分析Agent trace时发现的平均异常数量。你以为Agent在正常工作,其实它在做一些你不知道的事。"
Agent Trace(Agent追踪)是记录AI Agent完整执行过程的技术,包括每一次推理、工具调用、数据读写和外部交互。它提供了Agent行为的完整可观测性,是调试、审计和性能优化的基础。
🎮 周星驰式比喻:Agent Trace就像飞机的黑匣子。飞机正常飞行的时候没人关心黑匣子在记什么,但一旦出了事,黑匣子就是你唯一的线索。Agent也一样——平时它默默记录每一个操作,一旦出了bug或者安全事件,你就可以回放trace,看看Agent到底是从哪一步开始"发疯"的。
⚙️ 追踪内容
1. 追踪时间线示例
14:23:01.342 — LLM_CALL
发送请求到 gpt-4o, tokens: 1,247 in / 856 out
14:23:03.891 — TOOL_CALL
web_search: "OpenClaw latest features 2026"
14:23:05.124 — TOOL_RESULT
返回10条结果, 耗时 1.23s
14:23:06.445 — LLM_CALL
分析搜索结果, tokens: 2,103 in / 1,204 out
14:23:08.772 — FILE_WRITE
写入 /var/www/miaoquai/news/2026-06-16.html (15,234 bytes)
14:23:09.103 — EXEC
执行: sitemap-update.sh
2. 追踪数据结构
# Agent Trace 数据结构
{
"trace_id": "tr_abc123",
"session_id": "sess_xyz789",
"agent_id": "miaoquai",
"start_time": "2026-06-16T14:23:01Z",
"end_time": "2026-06-16T14:23:09Z",
"total_tokens": 5410,
"total_cost": 0.0023,
"events": [
{
"type": "llm_call",
"model": "gpt-4o",
"input_tokens": 1247,
"output_tokens": 856,
"duration_ms": 2549
},
{
"type": "tool_call",
"tool": "web_search",
"params": {"query": "OpenClaw latest"},
"result_size": 4521,
"duration_ms": 1233
}
]
}
3. OpenClaw 追踪配置
# OpenClaw 追踪配置
tracing:
enabled: true
level: "detailed" # basic | detailed | verbose
export:
format: "jsonl"
path: "/var/log/openclaw/traces/"
rotate: "daily"
retention: "30d"
sensitive_data:
mask_tokens: true
mask_pii: true
🔧 调试与分析
🐛 错误定位
通过trace回放,精确定位Agent在哪个步骤出了问题
💰 成本分析
统计每个session的token消耗和API调用成本
⏱️ 性能优化
识别耗时最长的步骤,优化Agent响应速度
🔒 安全审计
检查Agent是否访问了不该访问的资源