NVIDIA发布BioNeMo Agent Toolkit 将生物分子模型化为AI代理可调用技能，药物发现效率翻倍

背景

在药物研发场景中，AI 代理需要调用专业的生物分子模型才能完成折叠、对接、分子生成等关键步骤。传统的编程接口往往缺乏统一的文档和错误处理，使得代理的可靠性受限。NVIDIA 通过 BioNeMo Agent Toolkit，直接把这些模型包装成可被代理读取的 Skill，实现了“模型即技能、技能即服务”。

BioNeMo Agent Toolkit 核心概念

Skill：每个 Skill 对应一个生物分子模型，包含模型目的、输入参数、可选参数、产出文件以及常见失败模式的完整描述。
Model Context Protocol (MCP)：为尚未在 NIM（NVIDIA Inference Microservice）中封装的开源模型提供统一的服务包装层。
NIM 与本地部署：Skill 可通过 NVIDIA 托管的 NIM 端点快速调用，也支持在本地 GPU 节点上部署，实现低延迟和数据本地化。

技能实现方式

每个 Skill 以目录形式组织，核心文件为 SKILL.md，其结构如下：

---
name: openfold3-fold
model: OpenFold3
purpose: 蛋白质折叠预测
inputs:
  - sequence: 蛋白质氨基酸序列（FASTA）
outputs:
  - cif: 预测结构文件（CIF）
failure_modes:
  - low_confidence: 置信度低于阈值时返回警告
---

代理读取该文件后即可依据统一的 Prompt 模式发起调用，无需手工编写每个模型的 API 文档。

基准测试结果

NVIDIA 采用 Codex CLI 运行 GPT‑5.5‑fast，对比 无 Skill 与 使用 BioNeMo Skill 两种情形：

任务完成率：57.1% → 100%
Token 效率：每千 token 的通过断言数提升约 2 倍
覆盖模型：包括 Boltz‑2、OpenFold3、DiffDock、GenMol、ProteinMPNN、RFdiffusion 等十余个 Skill，提升在所有模型上保持一致。

这些数据表明，标准化的 Skill 能显著降低代理的猜测成本，使其更快找到正确模型、正确输入格式并解释输出。

应用场景示例

蛋白质结构预测：使用 openfold3-fold Skill 将肽段序列折叠为 CIF 文件，供后续分子动力学分析。
多序列比对：msa-search Skill 调用 MMseqs2，返回 A3M 格式的比对结果。
生成化学分子：genmol-generate Skill 输出 SDF 或 SMILES，直接进入虚拟筛选管线。
蛋白质结合体设计：generative_protein_binder_design 工作流链式调用 RFdiffusion → ProteinMPNN → OpenFold3，实现从骨架生成到序列设计再到结构验证的全闭环。

部署与使用注意

API 密钥：调用托管 NIM 端点需提供 NVIDIA API Key，适用于小规模开发与测试。
本地部署：如需大规模推理或数据合规，可将模型镜像至本地 GPU 节点，使用 npx skills add … --skill <skill-name> --agent <agent> 安装。
安全与验证：NVIDIA 明确提示，托管端点仅供研发使用；生产环境必须自行验证低置信度结构或生成分子的化学合理性。

展望

BioNeMo Agent Toolkit 为 AI 代理在生物医药领域的落地提供了统一的工具链，降低了跨模型集成的技术门槛。随着更多模型加入 Skill 库，预计未来 AI 代理将在药物靶点发现、分子优化等环节实现更高的自动化水平，进一步加速新药研发的周期。