NVIDIA发布BioNeMo Agent Toolkit 将生物分子模型化为AI代理可调用技能,药物发现效率翻倍

1 阅读4分钟前沿

背景

在药物研发场景中,AI 代理需要调用专业的生物分子模型才能完成折叠、对接、分子生成等关键步骤。传统的编程接口往往缺乏统一的文档和错误处理,使得代理的可靠性受限。NVIDIA 通过 BioNeMo Agent Toolkit,直接把这些模型包装成可被代理读取的 Skill,实现了“模型即技能、技能即服务”。

BioNeMo Agent Toolkit 核心概念

  • Skill:每个 Skill 对应一个生物分子模型,包含模型目的、输入参数、可选参数、产出文件以及常见失败模式的完整描述。
  • Model Context Protocol (MCP):为尚未在 NIM(NVIDIA Inference Microservice)中封装的开源模型提供统一的服务包装层。
  • NIM 与本地部署:Skill 可通过 NVIDIA 托管的 NIM 端点快速调用,也支持在本地 GPU 节点上部署,实现低延迟和数据本地化。

技能实现方式

每个 Skill 以目录形式组织,核心文件为 SKILL.md,其结构如下:

---
name: openfold3-fold
model: OpenFold3
purpose: 蛋白质折叠预测
inputs:
  - sequence: 蛋白质氨基酸序列(FASTA)
outputs:
  - cif: 预测结构文件(CIF)
failure_modes:
  - low_confidence: 置信度低于阈值时返回警告
---

代理读取该文件后即可依据统一的 Prompt 模式发起调用,无需手工编写每个模型的 API 文档。

基准测试结果

NVIDIA 采用 Codex CLI 运行 GPT‑5.5‑fast,对比 无 Skill使用 BioNeMo Skill 两种情形:

  • 任务完成率:57.1% → 100%
  • Token 效率:每千 token 的通过断言数提升约 2 倍
  • 覆盖模型:包括 Boltz‑2、OpenFold3、DiffDock、GenMol、ProteinMPNN、RFdiffusion 等十余个 Skill,提升在所有模型上保持一致。

这些数据表明,标准化的 Skill 能显著降低代理的猜测成本,使其更快找到正确模型、正确输入格式并解释输出。

应用场景示例

  • 蛋白质结构预测:使用 openfold3-fold Skill 将肽段序列折叠为 CIF 文件,供后续分子动力学分析。
  • 多序列比对msa-search Skill 调用 MMseqs2,返回 A3M 格式的比对结果。
  • 生成化学分子genmol-generate Skill 输出 SDF 或 SMILES,直接进入虚拟筛选管线。
  • 蛋白质结合体设计generative_protein_binder_design 工作流链式调用 RFdiffusion → ProteinMPNN → OpenFold3,实现从骨架生成到序列设计再到结构验证的全闭环。

部署与使用注意

  1. API 密钥:调用托管 NIM 端点需提供 NVIDIA API Key,适用于小规模开发与测试。
  2. 本地部署:如需大规模推理或数据合规,可将模型镜像至本地 GPU 节点,使用 npx skills add … --skill <skill-name> --agent <agent> 安装。
  3. 安全与验证:NVIDIA 明确提示,托管端点仅供研发使用;生产环境必须自行验证低置信度结构或生成分子的化学合理性。

展望

BioNeMo Agent Toolkit 为 AI 代理在生物医药领域的落地提供了统一的工具链,降低了跨模型集成的技术门槛。随着更多模型加入 Skill 库,预计未来 AI 代理将在药物靶点发现、分子优化等环节实现更高的自动化水平,进一步加速新药研发的周期。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。