GBrain开启自连线记忆层，让AI代理永不遗忘

背景与意义

AI 代理在每次对话结束后往往会丢失上下文，导致同一任务需要重复信息输入。GBrain 由 Y Combinator CEO Garry Tan 开源，旨在通过 markdown‑first、Postgres‑backed 的记忆层，实现 持久化、结构化、低成本 的知识管理。项目已在 Garry 个人的 OpenClaw 与 Hermes 部署中实战，累计索引 146,656 页、24,585 人物、5,339 公司。

关键特性

本地 PGLite 引擎：Postgres 17 编译为 WASM，无需 Docker 或远程服务器，启动仅数秒。
零 LLM 调用的图谱构建：基于正则的层级推理链（FOUNDED → INVESTED → ADVISES → WORKS_AT → MENTIONS），自动从 markdown 链接生成 typed edge。
混合检索管线：向量（pgvector）+ BM25 + Reciprocal Rank Fusion + ZeroEntropy 重排序，BrainBench 上 P@5 达 49.1%，R@5 达 97.9%，比禁用图层提升 31.4 分。
MCP 原生工具集：暴露 74 条标准化工具（get_page、query、add_link 等），可直接接入 Claude Code、Cursor、Windsurf 等 AI 助手。

快速上手（约 20 分钟）

1. 环境准备

# 安装 Bun（GBrain 运行时）
curl -fsSL https://bun.sh/install | bash
exec $SHELL
bun --version

# 全局安装 GBrain
bun install -g github:garrytan/gbrain

gbrain --version   # 0.38.2.0

2. 初始化本地脑库

# 创建本地 PGLite 数据库（无服务依赖）
gbrain init --pglite --no-embedding
# 输出示例：Brain ready at ~/.gbrain/brain.pglite 0 pages.

3. 构建 markdown 知识库

在 ~/my-brain/ 目录下创建 people/、companies/、concepts/ 三类文件夹，使用全路径 wikilink（如 [[people/alice-chen]]）记录人物、公司与概念的关联。

4. 导入并抽取图谱

# 导入 markdown，跳过 embedding
gbrain import ~/my-brain/ --no-embed
# 抽取链接生成 typed edge
gbrain extract links --source db

运行后可通过 gbrain graph-query people/alice-chen --depth 1 查看一跳关系。

5. 混合搜索

# 仅关键词搜索（无需 embedding）
gbrain search "inference"
# 开启向量检索并使用默认 ZeroEntropy 重排序
export OPENAI_API_KEY=sk-*****
gbrain config set embedding_model openai:text-embedding-3-large
gbrain embed --all   # 批量生成向量

gbrain query "who works on small-model inference?"

6. 与 Claude Code 互联

claude mcp add gbrain -- gbrain serve   # 启动 stdio MCP 服务器
claude mcp list                         # 确认 gbrain 已注册

此后在 Claude 对话中直接提问 “搜索脑库中关于 inference optimization 的内容”，系统会调取 gbrain query 返回结构化答案。

7. 自动化与运维

Autopilot：gbrain autopilot --install 启动 5 分钟一次的 cron 循环，自动同步、抽取、嵌入、合成。
Remediation：gbrain doctor --remediate --target-score 90 --max-usd 5 自动修复知识图谱错误并限制成本。
迁移：当本地 PGLite 接近 50K 页面上限时，可一键 gbrain migrate --to supabase 切换到云端 Postgres。

价值评估

GBrain 将 可编辑的 markdown 设为唯一事实来源，保证人类随时可审阅并手动纠错；同时 正则驱动的图谱 完全免除 LLM 调用成本，使得结构化查询（如 “谁在 Acme AI 工作？”）变得即时且精准。对比仅使用向量 DB 的方案，实验数据显示 P@5 提升 31.4 分，显著提升检索质量。

展望

随着社区对 skill（肥 markdown 工作流）的持续贡献，GBrain 有望演进为“一键即用的记忆即服务”。未来可结合多模态嵌入、实时语音摄取等插件，将代理记忆扩展至更广的业务场景。

本文基于 Garry Tan 在 GitHub 开源的 GBrain 项目（MIT 许可证）撰写，所有命令均已在 macOS/Linux 环境中实测通过。