英伟达、Google DeepMind、EMBL-EBI等联合发布全球最大蛋白质复合物数据集，加速AI药物研发

发布时间：2026-03-20来源：医药魔方网

在人工智能与生命科学深度融合的浪潮中，一项具有里程碑意义的合作成果近期在NVIDIA GTC 2026正式亮相。NVIDIA、Google DeepMind、欧洲分子生物学实验室旗下的欧洲生物信息学研究所（EMBL-EBI）以及首尔大学 Steinegger 实验室，对 AlphaFold 蛋白质结构数据库进行了大规模扩展：新增了 170 万个高置信度预测的蛋白质复合物，并提供约 3000 万个额外预测结构供批量下载。

这一新增数据集是同类中规模最大的，使该数据库成为一个前所未有的大规模蛋白质相互作用建模综合资源。

数据库中的蛋白质结构由 Google DeepMind 的 AlphaFold-Multimer 模型通过 AI 预测生成。同时，通过在 OpenFold 推理流程中集成 NVIDIA 的计算库（包括 NVIDIA TensorRT 和 cuEquivariance），实现了超过 100 倍的推理加速，相比原始方法大幅提升效率。

该数据库以“预计算”的蛋白质结构形式提供研究假设，从而加速新药靶点发现和疾病生物学研究中的实验验证过程。这一成果显著降低了科研门槛，尤其对缺乏先进超级计算资源的低资源环境研究人员而言，消除了巨大的计算障碍。

该项目优先覆盖“参考蛋白质组”（代表不同物种分类多样性的蛋白集合）以及世界卫生组织重点关注的病原体清单，以加强对传染病的研究支持。

对于制药行业而言，这些预测结构可作为强有力的初始研究假设，大幅加速后续湿实验（实验室实验）进程，节省宝贵的时间与资源。

这一由NVIDIA等机构推动的全球最大蛋白复合体数据集，不仅标志着AI在结构生物学领域的进一步成熟，也预示着未来药物研发将更加依赖数据驱动与智能预测。随着计算能力与算法的持续演进，生命科学研究正加速迈入“可预测”的新时代。

参考资料：

[1]https://www.embl.org/news/science-technology/first-complexes-alphafold-database/

前沿π》栏目

专访启德医药秦刚 | 从ADC到XDC，生物偶联药物酝酿未来无限可能
专访炫景生物李海涛| RNAi疗法“四大畅想”
专访清华大学石彦 | 中国first-in-class Treg药物的破局与野望
专访北京大学陈鹏 | 突破靶向蛋白降解边界——当靶向蛋白降解“遇见”膜蛋白

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。