GBrain开启自连线记忆层,让AI代理永不遗忘
背景与意义
AI 代理在每次对话结束后往往会丢失上下文,导致同一任务需要重复信息输入。GBrain 由 Y Combinator CEO Garry Tan 开源,旨在通过 markdown‑first、Postgres‑backed 的记忆层,实现 持久化、结构化、低成本 的知识管理。项目已在 Garry 个人的 OpenClaw 与 Hermes 部署中实战,累计索引 146,656 页、24,585 人物、5,339 公司。
关键特性
- 本地 PGLite 引擎:Postgres 17 编译为 WASM,无需 Docker 或远程服务器,启动仅数秒。
- 零 LLM 调用的图谱构建:基于正则的层级推理链(FOUNDED → INVESTED → ADVISES → WORKS_AT → MENTIONS),自动从 markdown 链接生成 typed edge。
- 混合检索管线:向量(pgvector)+ BM25 + Reciprocal Rank Fusion + ZeroEntropy 重排序,BrainBench 上 P@5 达 49.1%,R@5 达 97.9%,比禁用图层提升 31.4 分。
- MCP 原生工具集:暴露 74 条标准化工具(
get_page、query、add_link等),可直接接入 Claude Code、Cursor、Windsurf 等 AI 助手。
快速上手(约 20 分钟)
1. 环境准备
# 安装 Bun(GBrain 运行时)
curl -fsSL https://bun.sh/install | bash
exec $SHELL
bun --version
# 全局安装 GBrain
bun install -g github:garrytan/gbrain
gbrain --version # 0.38.2.0
2. 初始化本地脑库
# 创建本地 PGLite 数据库(无服务依赖)
gbrain init --pglite --no-embedding
# 输出示例:Brain ready at ~/.gbrain/brain.pglite 0 pages.
3. 构建 markdown 知识库
在 ~/my-brain/ 目录下创建 people/、companies/、concepts/ 三类文件夹,使用全路径 wikilink(如 [[people/alice-chen]])记录人物、公司与概念的关联。
4. 导入并抽取图谱
# 导入 markdown,跳过 embedding
gbrain import ~/my-brain/ --no-embed
# 抽取链接生成 typed edge
gbrain extract links --source db
运行后可通过 gbrain graph-query people/alice-chen --depth 1 查看一跳关系。
5. 混合搜索
# 仅关键词搜索(无需 embedding)
gbrain search "inference"
# 开启向量检索并使用默认 ZeroEntropy 重排序
export OPENAI_API_KEY=sk-*****
gbrain config set embedding_model openai:text-embedding-3-large
gbrain embed --all # 批量生成向量
gbrain query "who works on small-model inference?"
6. 与 Claude Code 互联
claude mcp add gbrain -- gbrain serve # 启动 stdio MCP 服务器
claude mcp list # 确认 gbrain 已注册
此后在 Claude 对话中直接提问 “搜索脑库中关于 inference optimization 的内容”,系统会调取 gbrain query 返回结构化答案。
7. 自动化与运维
- Autopilot:
gbrain autopilot --install启动 5 分钟一次的 cron 循环,自动同步、抽取、嵌入、合成。 - Remediation:
gbrain doctor --remediate --target-score 90 --max-usd 5自动修复知识图谱错误并限制成本。 - 迁移:当本地 PGLite 接近 50K 页面上限时,可一键
gbrain migrate --to supabase切换到云端 Postgres。
价值评估
GBrain 将 可编辑的 markdown 设为唯一事实来源,保证人类随时可审阅并手动纠错;同时 正则驱动的图谱 完全免除 LLM 调用成本,使得结构化查询(如 “谁在 Acme AI 工作?”)变得即时且精准。对比仅使用向量 DB 的方案,实验数据显示 P@5 提升 31.4 分,显著提升检索质量。
展望
随着社区对 skill(肥 markdown 工作流)的持续贡献,GBrain 有望演进为“一键即用的记忆即服务”。未来可结合多模态嵌入、实时语音摄取等插件,将代理记忆扩展至更广的业务场景。
本文基于 Garry Tan 在 GitHub 开源的 GBrain 项目(MIT 许可证)撰写,所有命令均已在 macOS/Linux 环境中实测通过。