英伟达、Google DeepMind、EMBL-EBI等联合发布全球最大蛋白质复合物数据集,加速AI药物研发

这一新增数据集是同类中规模最大的,使该数据库成为一个前所未有的大规模蛋白质相互作用建模综合资源。
数据库中的蛋白质结构由 Google DeepMind 的 AlphaFold-Multimer 模型通过 AI 预测生成。同时,通过在 OpenFold 推理流程中集成 NVIDIA 的计算库(包括 NVIDIA TensorRT 和 cuEquivariance),实现了超过 100 倍的推理加速,相比原始方法大幅提升效率。
该数据库以“预计算”的蛋白质结构形式提供研究假设,从而加速新药靶点发现和疾病生物学研究中的实验验证过程。这一成果显著降低了科研门槛,尤其对缺乏先进超级计算资源的低资源环境研究人员而言,消除了巨大的计算障碍。
该项目优先覆盖“参考蛋白质组”(代表不同物种分类多样性的蛋白集合)以及世界卫生组织重点关注的病原体清单,以加强对传染病的研究支持。
对于制药行业而言,这些预测结构可作为强有力的初始研究假设,大幅加速后续湿实验(实验室实验)进程,节省宝贵的时间与资源。
这一由NVIDIA等机构推动的全球最大蛋白复合体数据集,不仅标志着AI在结构生物学领域的进一步成熟,也预示着未来药物研发将更加依赖数据驱动与智能预测。随着计算能力与算法的持续演进,生命科学研究正加速迈入“可预测”的新时代。
参考资料:
[1]https://www.embl.org/news/science-technology/first-complexes-alphafold-database/
前沿π》栏目
专访启德医药秦刚 | 从ADC到XDC,生物偶联药物酝酿未来无限可能
专访炫景生物李海涛| RNAi疗法“四大畅想”
专访清华大学石彦 | 中国first-in-class Treg药物的破局与野望
专访北京大学陈鹏 | 突破靶向蛋白降解边界——当靶向蛋白降解“遇见”膜蛋白

