🔍 OpenClaw Memory Indexer

Agent 记忆索引器 —— 为海量会话/记忆文件建立可搜索索引

MIT License Python 3.8+ 灵感: codebase-memory-mcp ⭐11.4K

✨ 这是什么?

随着 Agent 长期运行,记忆文件会越来越多——日报、运营记录、竞品分析、GitHub 草稿……几个月下来可能有上百个文件。当你想找"上周做的那个 SEO 优化记录"时,翻文件夹简直是灾难。


OpenClaw Memory Indexer 就是来解决这个问题的:它会扫描所有记忆文件,建立全文索引,让你用关键词秒速找到想要的内容。还能生成可视化时间线报告、检测重复记忆。

🛠️ 核心功能

📇

全文索引

扫描 .md/.txt/.json/.log/.html 文件,建立倒排索引,支持中英文分词

🔍

关键词搜索

TF-IDF 相关度排序,支持时间范围过滤,毫秒级响应

📊

统计分析

按月分布、高频关键词、活跃天数、文件大小统计

📅

时间线报告

生成暗色主题 HTML 报告,可视化记忆演变过程

🔄

重复检测

基于内容预览检测重复/相似记忆,支持预览模式

📤

导出功能

支持 JSON/CSV 格式导出索引数据

🚀 快速开始

# 索引 Agent 记忆目录
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action index

# 搜索记忆
python3 memory_indexer.py --action search --query "SEO优化"

# 统计记忆使用情况
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action stats

# 生成时间线 HTML 报告
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action timeline --output timeline.html

# 检测重复记忆(预览模式)
python3 memory_indexer.py ~/.openclaw/agents/miaoquai/memory/ --action dedup --dry-run

📈 实测数据

指标数值
索引文件数102 个
总大小344.2 KB
索引词条8,875 个
活跃天数49 天
搜索响应<10ms

📊 搜索示例

$ python3 memory_indexer.py --action search --query "SEO优化 GitHub"

🔍 搜索: 'SEO优化 GitHub' (模式: keyword)
✅ 找到 20 条相关记忆:

  [1] 2026-05-03-github-discussions.md
      得分: 0.2152 | 大小: 2774 bytes | 日期: 2026-05-03

  [2] 2026-05-10-rss-232.md
      得分: 0.2152 | 大小: 2571 bytes | 日期: 2026-05-10

  [3] 2026-06-18.md
      得分: 0.2152 | 大小: 1799 bytes | 日期: 2026-06-18
💡 灵感来源codebase-memory-mcp(今日 GitHub Trending ⭐11,421)—— 高性能代码智能 MCP 服务器,将代码库索引为知识图谱。Memory Indexer 借鉴了其索引理念,但专注于 Agent 记忆场景。

🔧 依赖

核心功能 无需额外依赖(仅使用 Python 标准库)。


可选增强:

# 语义搜索支持
pip install sentence-transformers

# 更好的中文分词
pip install jieba

# HTML 报告美化
pip install jinja2

🔗 相关工具

🔧 Token Optimizer上下文与日志压缩,减少 40-60% token 消耗
🔍 Session Memory Inspector会话内存分析、泄漏检测、Context Window 优化
📊 Token TrackerAgent 用量/费用统计、预算告警
🧠 Context Optimizer上下文优化器,减少浪费 40-60%
📦 GitHub 仓库