腾讯开源TencentDB Agent Memory打造四层本地记忆管线,令Agent令牌消耗降超60%

92 阅读4分钟开源

背景与挑战

在长时序AI Agent应用中,工具调用日志、搜索结果和代码片段会迅速膨胀对话上下文,导致令牌消耗爆炸和检索准确率下降。多数现有记忆框架采用单一向量库,将所有碎片平铺存储,检索时缺乏宏观结构指引,难以实现高效的上下文回溯。

系统架构

TencentDB Agent Memory 将记忆划分为两大模块:

  • 符号化短期记忆:通过Mermaid语法将工具日志压缩为轻量任务画布,仅保留关键状态转移节点;完整日志持久化于 refs/*.md 文件中,按需检索。
  • 四层长周期记忆金字塔
    • L0 Conversation:原始对话记录。
    • L1 Atom:抽取的原子事实(JSONL)。
    • L2 Scenario:场景块(Markdown)。
    • L3 Persona:用户画像(Markdown),每 50 条新记忆自动生成。

检索流程遵循自上而下的确定性钻取:先查询 Persona,若未命中则逐层向下至 Scenario、Atom,最终落回 Conversation。

关键特性

  • 全本地化:默认后端为 SQLite + sqlite-vec,无需外部 API,亦提供可选的腾讯云向量数据库(TCVDB)方案。
  • 混合检索:BM25 关键字搜索 + 向量相似度,采用 Reciprocal Rank Fusion(RRF)融合,提高召回质量。
  • 插件化交付:作为 OpenClaw 插件 @tencentdb-agent-memory/memory-tencentdb 与 Hermes Docker 镜像提供,一键启用。
  • 多语言分词:内置 jieba 中文分词和英文分词,支持中英混合对话。

性能评估

腾讯内部基准覆盖连续长任务会话(如 SWE‑bench 50 步连贯任务),主要指标如下:

  • WideSearch:通过插件后通过率从 33% 提升至 50%(+51.52%),令牌使用从 221.31M 降至 85.64M(‑61.38%)。
  • SWE‑bench:成功率从 58.4% 提升至 64.2%(+9.93%),令牌从 3474.1M 降至 2375.4M(‑33.09%)。
  • AA‑LCR:成功率从 44.0% 提升至 47.5%(+7.95%),令牌从 112.0M 降至 77.3M(‑30.98%)。
  • PersonaMem:用户画像记忆准确率从 48% 跃升至 76%(+59%)。

这些数据表明,层次化记忆与符号化压缩能够显著降低上下文令牌成本,同时提升任务完成率。

部署与使用

  1. OpenClaw 插件npm i @tencentdb-agent-memory/memory-tencentdb,在 ~/.openclaw/openclaw.json 中启用 memory-tencentdb.enabled: true
  2. Hermes Docker:构建 Dockerfile.hermes,运行容器时指定模型(默认 DeepSeek‑V3.2),通过环境变量 MODEL_PROVIDER=custom 接入任意 OpenAI 兼容接口。
  3. 工具调用:Agent 在会话中可使用 tdai_memory_search(跨层检索)和 tdai_conversation_search(原始对话检索),返回 node_idresult_ref 供后续定位。

未来展望

Roadmap 包括便携式记忆迁移、自动技能生成以及可视化调试面板,进一步降低开发者调试成本并促进 Agent 生态的快速迭代。


TencentDB Agent Memory 的开源为构建高效、可解释的长时序 Agent 提供了完整的本地化方案,值得关注 AI 基础设施和自主可控路线的开发者深入探索。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。