GPT-5.5 发布:掉队已久的 OpenAI,居然又追回来了?
根据外媒最新消息,Anthropic 在二级市场的估值已经摸到了 1 万亿美元的门槛。对照一下,OpenAI 今年 3 月那轮融资里的估值只有是 8520 亿美元。
已经在 AI 王座上坐了很久的 OpenAI,第一次清楚地感受到来自最大竞争对手的追赶压迫。好在 OpenAI 没有让外界等太久,反击在几乎同一时间到位。
就在北京时间半夜,GPT-5.5 正式上线,同时还有针对更复杂任务的 GPT-5.5 Pro 版本。

用一句话说清 GPT-5.5 的核心思路,大概是这样的:把一个混乱、跨多个步骤的复杂任务整个甩给模型,由它自己规划路径、调用工具、验证结果、消除模糊地带,一路推进。
看起来只是 0.1 的版本号变动,推理效率上的差异却像是跨了一个大版本。
同样用 OpenAI 的桌面客户端 Codex 执行任务,GPT-5.5 用掉的 token 明显更少。
跑分屠榜不讲武德
只看基准测试和各种跑分成绩的话,GPT-5.5 再一次把桌子掀了。
第三方评测机构 Artificial Analysis 的综合智能指数榜单上,OpenAI 用 GPT-5.5 系列拿走了第一和第二,前六名里占了四席。其他厂商毫无招架之力。

Terminal-Bench 2.0 复杂命令行工作流测试,GPT-5.5 拿到 82.7%,前代 GPT-5.4 是 75.1%,而 Claude Opus 4.7 只有 69.4%。
SWE-Bench Pro 是评估处理真实 GitHub 问题能力的测试,GPT-5.5 在单次运行里端到端完成更多任务,分数是 58.6%,比 GPT-5.4 的 57.7% 高一点。

智能体编码、computer use、知识工作以及早期科学研究这几个方向,GPT-5.5 的进步最明显。
早期试用者的反馈是,GPT-5.5 理解大型代码库整体结构的能力上了一个台阶,能主动预判潜在问题,提前考虑测试和审查的需求,不需要你额外给提示。
Cursor 联合创始人 Michael Truell 认为 GPT-5.5 比 5.4 更聪明、更有韧性,工具调用更稳定,面对那种长期的复杂任务能撑得更久而不会半路放弃——这也是对面 Opus 4.7 发布的时候宣称的,但在用户实测中没有真正做到的……
在推理基础设施的协同升级上。 GPT-5.5 是在 NVIDIA GB200、GB300 NVL72 系统上联合训练的,token 生成速度提了超过 20%。
OpenAI 也提到,GPT-5.5 自己也参与了改进自身推理基础设施的过程。
价格方面,GPT-5.5 即日起向 ChatGPT Plus、Pro、Business、Enterprise 用户开放,Codex 支持最高 400K 上下文窗口,并提供 1.5 倍速的 Fast 模式(费用是标准价的 2.5 倍);GPT-5.5 Pro 面向 ChatGPT 的 Pro、Business 和 Enterprise 用户。
GPT 5.5 的 API 计费是每百万输入 token 5 美元、每百万输出 token 30 美元,上下文窗口 1M toke。
这个定价,跟 Opus 4.7 在同一区间。OpenAI 说话的时候只字不提 Claude Opus 4.7,但句句都在内涵。

OpenAI 想做的,是 AI 时代的入口
网友 @chetaslua 用一条提示词在 Codex 里生成了一个带有风效应物理引擎的完整网站,物理交互和界面设计同时到位。他的感叹是「这是我第一次觉得 ChatGPT 可以成为解决一切问题的首选 AI 工具」。

也有用户觉得 GPT-5.5 的工作并不令人满意。网友 @arrakis_ai 发现 GPT-5.5 遇到复杂布局的时候有时候会直接生成一张图片应付过去,处理图标需求的时候会从头硬写 SVG,而不是调用现成库,并且频繁停下来追问用户,执行力反而不如以前果断。

在写作的文笔上,我们自己的体验也类似。GPT-5.5 比前代会组织语言一些,至少能说点人话了,但还是有股怪味:「我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你」诸如此类的经典 GPT 新话,仍然存在……
回到基准测试分数来看,GPT-5.5 和 Anthropic 一直藏着不给大家用的传奇模型 Mythos,之间的差距似乎没有想象的那么悬殊,而 Mythos 的定价是 GPT-5.5 的两倍,甚至不公开发售。

Techcrunch 的记者追问「GPT-5.5 是否具备类似 Mythos 能力」时,OpenAI 技术人员 Mia Glaese 给出了一个滴水不漏却暗藏锋芒的回答:「我们在网络安全方面有着长期且强有力的战略,并且已经完善了一套持久的、安全推出模型的方法。」
GPT-5.5 上线之后,OpenAI 的野心也清晰了:他们已经不满足于做一个聪明的聊天机器人,要亲手造一个能吞下所有工作流的「AI 超级应用」(Super app)。
接受外媒采访时,OpenAI 总裁 Greg Brockman 用「自主性」(Agentic)这个词形容这一代模型的跨越。和 GPT-5.4 比起来,GPT-5.5 用掉的 token 更少,但思考速度更快、逻辑更清晰,开始展现出主动解决复杂问题的能力。
所谓超级应用,就是把 ChatGPT、Codex 和 AI 浏览器深度融合成同一个服务。

可以想象未来的工作流:用户不必在浏览器、代码编辑器、数据分析工具之间来回切。只要对着这个超级应用下一个命令,GPT-5.5 就能在后台自己打开网页搜集资料、写爬虫代码、清洗数据,最后直接把一份完整的分析报告递到你手里。
Anthropic 把 Claude 和 Claude Code 强绑定,OpenAI 也在替 Codex 的增长势头添柴。
最近奥特曼透露,Codex 活跃用户在突破 300 万不到两周后就摸到了 400 万,OpenAI 顺势重置了速率限制,用「量大管饱」的姿态去收割开发者生态。
今年以来一直被说掉队的 OpenAI,重新找回了两年前的进攻节奏,并且这次它把精力放在了把产品打磨好这件事上。





