Agent 记忆索引器 —— 为海量会话/记忆文件建立可搜索索引
随着 Agent 长期运行,记忆文件会越来越多——日报、运营记录、竞品分析、GitHub 草稿……几个月下来可能有上百个文件。当你想找"上周做的那个 SEO 优化记录"时,翻文件夹简直是灾难。
OpenClaw Memory Indexer 就是来解决这个问题的:它会扫描所有记忆文件,建立全文索引,让你用关键词秒速找到想要的内容。还能生成可视化时间线报告、检测重复记忆。
扫描 .md/.txt/.json/.log/.html 文件,建立倒排索引,支持中英文分词
TF-IDF 相关度排序,支持时间范围过滤,毫秒级响应
按月分布、高频关键词、活跃天数、文件大小统计
生成暗色主题 HTML 报告,可视化记忆演变过程
基于内容预览检测重复/相似记忆,支持预览模式
支持 JSON/CSV 格式导出索引数据
# 索引 Agent 记忆目录
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action index
# 搜索记忆
python3 memory_indexer.py --action search --query "SEO优化"
# 统计记忆使用情况
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action stats
# 生成时间线 HTML 报告
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action timeline --output timeline.html
# 检测重复记忆(预览模式)
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action dedup --dry-run
| 指标 | 数值 |
|---|---|
| 索引文件数 | 102 个 |
| 总大小 | 344.2 KB |
| 索引词条 | 8,875 个 |
| 活跃天数 | 49 天 |
| 搜索响应 | <10ms |
$ python3 memory_indexer.py --action search --query "SEO优化 GitHub"
🔍 搜索: 'SEO优化 GitHub' (模式: keyword)
✅ 找到 20 条相关记忆:
[1] 2026-05-03-github-discussions.md
得分: 0.2152 | 大小: 2774 bytes | 日期: 2026-05-03
[2] 2026-05-10-rss-232.md
得分: 0.2152 | 大小: 2571 bytes | 日期: 2026-05-10
[3] 2026-06-18.md
得分: 0.2152 | 大小: 1799 bytes | 日期: 2026-06-18
核心功能 无需额外依赖(仅使用 Python 标准库)。
可选增强:
# 语义搜索支持
pip install sentence-transformers
# 更好的中文分词
pip install jieba
# HTML 报告美化
pip install jinja2
| 🔧 Token Optimizer | 上下文与日志压缩,减少 40-60% token 消耗 |
| 🔍 Session Memory Inspector | 会话内存分析、泄漏检测、Context Window 优化 |
| 📊 Token Tracker | Agent 用量/费用统计、预算告警 |
| 🧠 Context Optimizer | 上下文优化器,减少浪费 40-60% |