GBrain开启自连线记忆层,让AI代理永不遗忘

74 阅读6分钟开源

背景与意义

AI 代理在每次对话结束后往往会丢失上下文,导致同一任务需要重复信息输入。GBrain 由 Y Combinator CEO Garry Tan 开源,旨在通过 markdown‑first、Postgres‑backed 的记忆层,实现 持久化、结构化、低成本 的知识管理。项目已在 Garry 个人的 OpenClaw 与 Hermes 部署中实战,累计索引 146,656 页、24,585 人物、5,339 公司。

关键特性

  • 本地 PGLite 引擎:Postgres 17 编译为 WASM,无需 Docker 或远程服务器,启动仅数秒。
  • 零 LLM 调用的图谱构建:基于正则的层级推理链(FOUNDED → INVESTED → ADVISES → WORKS_AT → MENTIONS),自动从 markdown 链接生成 typed edge。
  • 混合检索管线:向量(pgvector)+ BM25 + Reciprocal Rank Fusion + ZeroEntropy 重排序,BrainBench 上 P@5 达 49.1%,R@5 达 97.9%,比禁用图层提升 31.4 分。
  • MCP 原生工具集:暴露 74 条标准化工具(get_pagequeryadd_link 等),可直接接入 Claude Code、Cursor、Windsurf 等 AI 助手。

快速上手(约 20 分钟)

1. 环境准备

# 安装 Bun(GBrain 运行时)
curl -fsSL https://bun.sh/install | bash
exec $SHELL
bun --version

# 全局安装 GBrain
bun install -g github:garrytan/gbrain

gbrain --version   # 0.38.2.0

2. 初始化本地脑库

# 创建本地 PGLite 数据库(无服务依赖)
gbrain init --pglite --no-embedding
# 输出示例:Brain ready at ~/.gbrain/brain.pglite 0 pages.

3. 构建 markdown 知识库

~/my-brain/ 目录下创建 people/companies/concepts/ 三类文件夹,使用全路径 wikilink(如 [[people/alice-chen]])记录人物、公司与概念的关联。

4. 导入并抽取图谱

# 导入 markdown,跳过 embedding
gbrain import ~/my-brain/ --no-embed
# 抽取链接生成 typed edge
gbrain extract links --source db

运行后可通过 gbrain graph-query people/alice-chen --depth 1 查看一跳关系。

5. 混合搜索

# 仅关键词搜索(无需 embedding)
gbrain search "inference"
# 开启向量检索并使用默认 ZeroEntropy 重排序
export OPENAI_API_KEY=sk-*****
gbrain config set embedding_model openai:text-embedding-3-large
gbrain embed --all   # 批量生成向量

gbrain query "who works on small-model inference?"

6. 与 Claude Code 互联

claude mcp add gbrain -- gbrain serve   # 启动 stdio MCP 服务器
claude mcp list                         # 确认 gbrain 已注册

此后在 Claude 对话中直接提问 “搜索脑库中关于 inference optimization 的内容”,系统会调取 gbrain query 返回结构化答案。

7. 自动化与运维

  • Autopilotgbrain autopilot --install 启动 5 分钟一次的 cron 循环,自动同步、抽取、嵌入、合成。
  • Remediationgbrain doctor --remediate --target-score 90 --max-usd 5 自动修复知识图谱错误并限制成本。
  • 迁移:当本地 PGLite 接近 50K 页面上限时,可一键 gbrain migrate --to supabase 切换到云端 Postgres。

价值评估

GBrain 将 可编辑的 markdown 设为唯一事实来源,保证人类随时可审阅并手动纠错;同时 正则驱动的图谱 完全免除 LLM 调用成本,使得结构化查询(如 “谁在 Acme AI 工作?”)变得即时且精准。对比仅使用向量 DB 的方案,实验数据显示 P@5 提升 31.4 分,显著提升检索质量。

展望

随着社区对 skill(肥 markdown 工作流)的持续贡献,GBrain 有望演进为“一键即用的记忆即服务”。未来可结合多模态嵌入、实时语音摄取等插件,将代理记忆扩展至更广的业务场景。


本文基于 Garry Tan 在 GitHub 开源的 GBrain 项目(MIT 许可证)撰写,所有命令均已在 macOS/Linux 环境中实测通过。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。