NVIDIA发布BioNeMo Agent Toolkit 将生物分子模型化为AI代理可调用技能,药物发现效率翻倍
•1 阅读•4分钟•前沿
NVIDIABioNeMoOpenFold3DiffDockGenMol
•1 阅读•4分钟•前沿
背景
在药物研发场景中,AI 代理需要调用专业的生物分子模型才能完成折叠、对接、分子生成等关键步骤。传统的编程接口往往缺乏统一的文档和错误处理,使得代理的可靠性受限。NVIDIA 通过 BioNeMo Agent Toolkit,直接把这些模型包装成可被代理读取的 Skill,实现了“模型即技能、技能即服务”。
BioNeMo Agent Toolkit 核心概念
- Skill:每个 Skill 对应一个生物分子模型,包含模型目的、输入参数、可选参数、产出文件以及常见失败模式的完整描述。
- Model Context Protocol (MCP):为尚未在 NIM(NVIDIA Inference Microservice)中封装的开源模型提供统一的服务包装层。
- NIM 与本地部署:Skill 可通过 NVIDIA 托管的 NIM 端点快速调用,也支持在本地 GPU 节点上部署,实现低延迟和数据本地化。
技能实现方式
每个 Skill 以目录形式组织,核心文件为 SKILL.md,其结构如下:
---
name: openfold3-fold
model: OpenFold3
purpose: 蛋白质折叠预测
inputs:
- sequence: 蛋白质氨基酸序列(FASTA)
outputs:
- cif: 预测结构文件(CIF)
failure_modes:
- low_confidence: 置信度低于阈值时返回警告
---
代理读取该文件后即可依据统一的 Prompt 模式发起调用,无需手工编写每个模型的 API 文档。
基准测试结果
NVIDIA 采用 Codex CLI 运行 GPT‑5.5‑fast,对比 无 Skill 与 使用 BioNeMo Skill 两种情形:
- 任务完成率:57.1% → 100%
- Token 效率:每千 token 的通过断言数提升约 2 倍
- 覆盖模型:包括 Boltz‑2、OpenFold3、DiffDock、GenMol、ProteinMPNN、RFdiffusion 等十余个 Skill,提升在所有模型上保持一致。
这些数据表明,标准化的 Skill 能显著降低代理的猜测成本,使其更快找到正确模型、正确输入格式并解释输出。
应用场景示例
- 蛋白质结构预测:使用
openfold3-foldSkill 将肽段序列折叠为 CIF 文件,供后续分子动力学分析。 - 多序列比对:
msa-searchSkill 调用 MMseqs2,返回 A3M 格式的比对结果。 - 生成化学分子:
genmol-generateSkill 输出 SDF 或 SMILES,直接进入虚拟筛选管线。 - 蛋白质结合体设计:
generative_protein_binder_design工作流链式调用 RFdiffusion → ProteinMPNN → OpenFold3,实现从骨架生成到序列设计再到结构验证的全闭环。
部署与使用注意
- API 密钥:调用托管 NIM 端点需提供 NVIDIA API Key,适用于小规模开发与测试。
- 本地部署:如需大规模推理或数据合规,可将模型镜像至本地 GPU 节点,使用
npx skills add … --skill <skill-name> --agent <agent>安装。 - 安全与验证:NVIDIA 明确提示,托管端点仅供研发使用;生产环境必须自行验证低置信度结构或生成分子的化学合理性。
展望
BioNeMo Agent Toolkit 为 AI 代理在生物医药领域的落地提供了统一的工具链,降低了跨模型集成的技术门槛。随着更多模型加入 Skill 库,预计未来 AI 代理将在药物靶点发现、分子优化等环节实现更高的自动化水平,进一步加速新药研发的周期。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。