GPT-5.5 发布：掉队已久的 OpenAI，居然又追回来了？

发布时间：2026-04-24来源：爱范儿

根据外媒最新消息，Anthropic 在二级市场的估值已经摸到了 1 万亿美元的门槛。对照一下，OpenAI 今年 3 月那轮融资里的估值只有是 8520 亿美元。

已经在 AI 王座上坐了很久的 OpenAI，第一次清楚地感受到来自最大竞争对手的追赶压迫。好在 OpenAI 没有让外界等太久，反击在几乎同一时间到位。

就在北京时间半夜，GPT-5.5 正式上线，同时还有针对更复杂任务的 GPT-5.5 Pro 版本。

用一句话说清 GPT-5.5 的核心思路，大概是这样的：把一个混乱、跨多个步骤的复杂任务整个甩给模型，由它自己规划路径、调用工具、验证结果、消除模糊地带，一路推进。

看起来只是 0.1 的版本号变动，推理效率上的差异却像是跨了一个大版本。

同样用 OpenAI 的桌面客户端 Codex 执行任务，GPT-5.5 用掉的 token 明显更少。

跑分屠榜不讲武德

只看基准测试和各种跑分成绩的话，GPT-5.5 再一次把桌子掀了。

第三方评测机构 Artificial Analysis 的综合智能指数榜单上，OpenAI 用 GPT-5.5 系列拿走了第一和第二，前六名里占了四席。其他厂商毫无招架之力。

Terminal-Bench 2.0 复杂命令行工作流测试，GPT-5.5 拿到 82.7%，前代 GPT-5.4 是 75.1%，而 Claude Opus 4.7 只有 69.4%。

SWE-Bench Pro 是评估处理真实 GitHub 问题能力的测试，GPT-5.5 在单次运行里端到端完成更多任务，分数是 58.6%，比 GPT-5.4 的 57.7% 高一点。

智能体编码、computer use、知识工作以及早期科学研究这几个方向，GPT-5.5 的进步最明显。

早期试用者的反馈是，GPT-5.5 理解大型代码库整体结构的能力上了一个台阶，能主动预判潜在问题，提前考虑测试和审查的需求，不需要你额外给提示。

Cursor 联合创始人 Michael Truell 认为 GPT-5.5 比 5.4 更聪明、更有韧性，工具调用更稳定，面对那种长期的复杂任务能撑得更久而不会半路放弃——这也是对面 Opus 4.7 发布的时候宣称的，但在用户实测中没有真正做到的……

在推理基础设施的协同升级上。 GPT-5.5 是在 NVIDIA GB200、GB300 NVL72 系统上联合训练的，token 生成速度提了超过 20%。

OpenAI 也提到，GPT-5.5 自己也参与了改进自身推理基础设施的过程。

价格方面，GPT-5.5 即日起向 ChatGPT Plus、Pro、Business、Enterprise 用户开放，Codex 支持最高 400K 上下文窗口，并提供 1.5 倍速的 Fast 模式（费用是标准价的 2.5 倍）；GPT-5.5 Pro 面向 ChatGPT 的 Pro、Business 和 Enterprise 用户。

GPT 5.5 的 API 计费是每百万输入 token 5 美元、每百万输出 token 30 美元，上下文窗口 1M toke。

这个定价，跟 Opus 4.7 在同一区间。OpenAI 说话的时候只字不提 Claude Opus 4.7，但句句都在内涵。

OpenAI 想做的，是 AI 时代的入口

网友 @chetaslua 用一条提示词在 Codex 里生成了一个带有风效应物理引擎的完整网站，物理交互和界面设计同时到位。他的感叹是「这是我第一次觉得 ChatGPT 可以成为解决一切问题的首选 AI 工具」。

也有用户觉得 GPT-5.5 的工作并不令人满意。网友 @arrakis_ai 发现 GPT-5.5 遇到复杂布局的时候有时候会直接生成一张图片应付过去，处理图标需求的时候会从头硬写 SVG，而不是调用现成库，并且频繁停下来追问用户，执行力反而不如以前果断。

在写作的文笔上，我们自己的体验也类似。GPT-5.5 比前代会组织语言一些，至少能说点人话了，但还是有股怪味：「我就在这里，不躲，不藏，不绕，不逃，稳稳地接住你」诸如此类的经典 GPT 新话，仍然存在……

回到基准测试分数来看，GPT-5.5 和 Anthropic 一直藏着不给大家用的传奇模型 Mythos，之间的差距似乎没有想象的那么悬殊，而 Mythos 的定价是 GPT-5.5 的两倍，甚至不公开发售。

Techcrunch 的记者追问「GPT-5.5 是否具备类似 Mythos 能力」时，OpenAI 技术人员 Mia Glaese 给出了一个滴水不漏却暗藏锋芒的回答：「我们在网络安全方面有着长期且强有力的战略，并且已经完善了一套持久的、安全推出模型的方法。」

GPT-5.5 上线之后，OpenAI 的野心也清晰了：他们已经不满足于做一个聪明的聊天机器人，要亲手造一个能吞下所有工作流的「AI 超级应用」（Super app）。

接受外媒采访时，OpenAI 总裁 Greg Brockman 用「自主性」（Agentic）这个词形容这一代模型的跨越。和 GPT-5.4 比起来，GPT-5.5 用掉的 token 更少，但思考速度更快、逻辑更清晰，开始展现出主动解决复杂问题的能力。

所谓超级应用，就是把 ChatGPT、Codex 和 AI 浏览器深度融合成同一个服务。

可以想象未来的工作流：用户不必在浏览器、代码编辑器、数据分析工具之间来回切。只要对着这个超级应用下一个命令，GPT-5.5 就能在后台自己打开网页搜集资料、写爬虫代码、清洗数据，最后直接把一份完整的分析报告递到你手里。

Anthropic 把 Claude 和 Claude Code 强绑定，OpenAI 也在替 Codex 的增长势头添柴。

最近奥特曼透露，Codex 活跃用户在突破 300 万不到两周后就摸到了 400 万，OpenAI 顺势重置了速率限制，用「量大管饱」的姿态去收割开发者生态。

今年以来一直被说掉队的 OpenAI，重新找回了两年前的进攻节奏，并且这次它把精力放在了把产品打磨好这件事上。

OpenAI 官方博客地址：

https://openai.com/index/introducing-gpt-5-5/

*封面由 AI 生成

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。