腾讯开源TencentDB Agent Memory打造四层本地记忆管线，令Agent令牌消耗降超60%

背景与挑战

在长时序AI Agent应用中，工具调用日志、搜索结果和代码片段会迅速膨胀对话上下文，导致令牌消耗爆炸和检索准确率下降。多数现有记忆框架采用单一向量库，将所有碎片平铺存储，检索时缺乏宏观结构指引，难以实现高效的上下文回溯。

TencentDB Agent Memory 将记忆划分为两大模块：

符号化短期记忆：通过Mermaid语法将工具日志压缩为轻量任务画布，仅保留关键状态转移节点；完整日志持久化于 refs/*.md 文件中，按需检索。
四层长周期记忆金字塔：
- L0 Conversation：原始对话记录。
- L1 Atom：抽取的原子事实（JSONL）。
- L2 Scenario：场景块（Markdown）。
- L3 Persona：用户画像（Markdown），每 50 条新记忆自动生成。

检索流程遵循自上而下的确定性钻取：先查询 Persona，若未命中则逐层向下至 Scenario、Atom，最终落回 Conversation。

全本地化：默认后端为 SQLite + sqlite-vec，无需外部 API，亦提供可选的腾讯云向量数据库（TCVDB）方案。
混合检索：BM25 关键字搜索 + 向量相似度，采用 Reciprocal Rank Fusion（RRF）融合，提高召回质量。
插件化交付：作为 OpenClaw 插件 @tencentdb-agent-memory/memory-tencentdb 与 Hermes Docker 镜像提供，一键启用。
多语言分词：内置 jieba 中文分词和英文分词，支持中英混合对话。

腾讯内部基准覆盖连续长任务会话（如 SWE‑bench 50 步连贯任务），主要指标如下：

这些数据表明，层次化记忆与符号化压缩能够显著降低上下文令牌成本，同时提升任务完成率。

OpenClaw 插件：npm i @tencentdb-agent-memory/memory-tencentdb，在 ~/.openclaw/openclaw.json 中启用 memory-tencentdb.enabled: true。
Hermes Docker：构建 Dockerfile.hermes，运行容器时指定模型（默认 DeepSeek‑V3.2），通过环境变量 MODEL_PROVIDER=custom 接入任意 OpenAI 兼容接口。
工具调用：Agent 在会话中可使用 tdai_memory_search（跨层检索）和 tdai_conversation_search（原始对话检索），返回 node_id 与 result_ref 供后续定位。

Roadmap 包括便携式记忆迁移、自动技能生成以及可视化调试面板，进一步降低开发者调试成本并促进 Agent 生态的快速迭代。

TencentDB Agent Memory 的开源为构建高效、可解释的长时序 Agent 提供了完整的本地化方案，值得关注 AI 基础设施和自主可控路线的开发者深入探索。