OpenAI为生命科学研究打造:GPT-Rosalind面世
将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯


编辑丨%
2026 年 4 月 16 日,为支持生物学、药物发现和转化医学研究,OpenAI 推出了他们专门打造的前沿推理模型 GPT-Rosalind。生命科学模型系列针对科学工作流程进行了优化,结合了工具的改进与对化学、蛋白质工程和基因组学的深入理解。
在美国,从靶点发现到新药获得监管批准,平均大约需要 10~15 年时间。生命科学的进步不仅受限于基础科学的难度,还受限于研究工作流程本身的复杂性。科学家必须跨越大量文献、专业数据库、实验数据和不断演变的假设,以产生和评估新想法。这些工作流程通常耗时、分散且难以扩展。
OpenAI 相信先进的人工智能系统可以帮助研究人员更快地完成这些工作流程——不仅通过提高现有工作效率,还帮助科学家探索更多可能性,揭示可能被忽视的联系,并更早得出更好的假设。
通过支持证据综合、假设生成、实验规划及其他多步骤研究任务,该模型旨在帮助研究人员加速早期发现阶段。随着时间推移,这些系统可以帮助生命科学组织发现原本不可能实现的突破,成功率也会大幅提升。
GPT-Rosalind 现已作为研究预览版,通过团队的可信访问计划,在 ChatGPT、Codex 及 API 中向合格客户开放。此外,更有可免费访问的生命科学研究插件,帮助科学家将模型连接到 50 多个科学工具和数据源。

图示:看看 GPT-Rosalind 套件如何转化为可衡量的研究工作流程改进。
性能与评估
团队评估了 GPT-Rosalind 在科学发现和工业研究基础上的多项能力。这些评估衡量了跨科学子领域的核心推理,包括化学反应机制;蛋白质结构、突变效应和相互作用;以及 DNA 序列的系统发育解释。
他们还通过解读实验结果、识别专家相关模式,并综合外部信息评估模型是否能支持真实的研究工作流程,设计后续实验。最后,他们测试模型是否能够选择并使用合适的计算工具、数据库和领域特定能力来增强推理。综合来看,这些评估显示了科学研究全过程的进展,表明他们更有效地帮助研究人员完成具有挑战性的发现任务。

图示:GPT-Rosalind 提升核心生物和化学基准。
此外,团队提供了部分可供参考的提示词,分别对应了有机化学、蛋白质理解、基因组学、实验设计与分析、工具使用等方面。

图示:工具使用相关的提示词。
行业评估
OpenAI 团队通过一系列公开基准测试评估了 GPT-Rosalind。在 BixBench 基准测试中,该基准以真实世界生物信息学和数据分析为核心,GPT-Rosalind 在已发布评分模型中取得了领先表现。

图示:GPT-Rosalind 在 BixBench 上表现出的领先性能。
在 LABBench2 这一衡量文献检索、数据库访问、序列操作和协议设计等多种研究任务表现的基准测试中,GPT-Rosalind 在 11 项任务中有 6 项优于 GPT-5.4。最显著的改进来自 CloningQA,它要求为分子克隆协议设计 DNA 和酶试剂的端到端。
此外,团队还与 Dyno Therapeutics(在 AI 设计基因疗法领域具有先驱性) 合作,利用未发表、未受污染的序列,在 RNA 序列到功能预测和生成任务中评估该模型。该表现与 57 项人工智能-生物领域人类专家的历史评分进行了比较。并在 Codex 应用中直接评估时,预测任务排名超过人类专家的第 95 百分位,序列生成任务中人类专家的排名约为第 84 百分位。
这些评估为科学家每天依赖的,用于产生证据、分析复杂数据并朝向可辩护的生物学结论迈进的工作流程,提供了有意义的表现信号。
连接科学家所用的工具
科学家可采用 OpenAI 团队开发的,适用于 Codex 的新生命科学研究插件。该软件包包含一套广泛的模块化技能,适用于大多数常见的研究工作流程,旨在帮助用户跨越人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据及公共研究发现等领域工作。
相关链接:https://github.com/openai/plugins/tree/main/plugins/life-science-research
这些技能作为协调层,帮助科学家更有效地处理宽泛、模糊且多步骤的问题。它们提供50多个公共多组学数据库、文献来源和生物学工具的访问,并为蛋白质结构查找、序列搜索、文献综述和公开数据集发现等常见可重复工作流程提供灵活的起点。
入门操作与未来
研究组织可通过相关的资格认证和安全审核流程申请访问权限。
相关链接:https://openai.com/form/life-sciences-access/
在研究预览期间,使用该模型不会消耗现有的信用点或代币——但会受到滥用保护措施的影响。随着项目扩展,团队后续将分享更多价格和供应信息。
生命科学模型旨在帮助科学组织在需要技术能力和运营控制的环境中,更快地完成更高质量的工作。
这是 OpenAI 生命科学系列首个模型的发布,他们认为这是构建能够加速科学发现的人工智能的长期承诺的开始,这些人工智能能够加速从人类健康到更广泛的生物研究等对社会极为重要的领域。团队将继续改进模型的生物学推理,扩大对工具密集和远景研究流程的支持,并与领先科学机构紧密合作,评估其现实世界影响。
团队同样在探索人工智能引导的蛋白质和催化剂设计,包括人工智能系统在保留或改善关键功能特性的同时修改生物结构的能力。随着时间推移,他们预计这些系统将成为越来越有能力的发现伙伴——帮助科学家更快地从问题走向证据,从证据到洞察,从洞察到患者新疗法。
原文链接:https://openai.com/index/introducing-gpt-rosalind/
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。
