深度丨从神模到平台:Sora 退场背后,AI 视频的剧本正在被重写

Sora 宣告下架。
如果把时间拨回一年前,这本该是一场足以让整个行业震动的标志性事件。
作为 AI 视频赛道曾经的绝对轴心,Sora 不仅仅是一个产品,它更像是一个时代的物理图腾:代表着最极致的模型想象、最接近电影的生成效果,以及硅谷对“下一代内容工业”的高调宣示。

然而,当靴子最终落地,外网的反应却冷静得反常。
主流商业媒体如 Business Insider 和 Reuters 的解读高度一致:这并非一次单纯的技术折戟,而是一次基于商业效率的“主动裁撤”。在算力成本高企、资本回归理性的背景下,OpenAI 正在进行一场残酷的资源重配,将火力重新集中在 ChatGPT、企业级产品及基础设施等核心阵地。
Sora 不是输给了某个竞争对手,而是输给了组织内部的优先级排序。
这种冷静恰恰说明,行业已经看清了一个事实:AI 视频正在从“技术奇观”的实验室阶段,步入“商业闭环”的深水区。
AI视频告别炼金术时代
AI 视频的上半场,很像炼金术时代。
那个阶段,最重要的不是效率,不是留存,也不是商业结构,而是“见证奇迹”。谁先把一件原本不可能的事做出来,谁就拥有定义未来的资格。Sora 之所以能在短时间里成为行业图腾,本质上不是因为它是一个多成熟的产品,而是因为它以一种极具冲击力的方式,让所有人第一次相信:AI 生成的视频不只是能看,而是真的开始逼近电影感,逼近未来内容工业的某种原型。
所以,过去两年,整个赛道最流行的一套叙事,其实就是“神模叙事”。
逻辑很简单:谁的模型效果最炸裂,谁就代表未来;谁最像技术奇观,谁就最容易被捧成行业图腾。那时候,很多人默认一件事:只要模型足够强,产品自然会成立;只要效果足够惊艳,商业化迟早会跟上。
Sora 这次收缩,真正打碎的是另一层更乐观、也更危险的幻觉:只要模型足够强,剩下的一切都会自动发生。
这才是整个行业开始转向的起点。

强模型只是参赛资格
今天如果还把 AI 视频理解成“谁模型最强谁就赢”,就有点像拿上半场的规则,去解释下半场的比赛。
因为到了 2026 年,行业对“模型能力”的理解已经变了。
强模型依然重要,甚至依然是这条赛道最核心的底座之一。没有模型能力,很多所谓的平台和应用最后都会变成寄生在别人底座上的薄壳。这一点,爱诗科技联合创始人谢旭璋在《晚点》的访谈里讲得很直接:2024 年 Sora 刚出来时,外界普遍觉得创业公司别再碰视频模型了,赶紧去做应用,但他们内部反而更坚定地继续把模型能力掌握在自己手里。因为在他们看来,底层能力不是锦上添花,而是生存底线。
这句话其实把问题说透了。
今天的问题从来不是“模型还重不重要”,而是:强模型已经从胜利答案,变成了参赛资格。
也就是说,模型依然决定上限,但它已经不再足以单独决定终局。
为什么?因为行业真正新增了三道门槛。用公式来表达就是:

第一道门槛,是可控性。 在上半场,大家痴迷的是“一键出片”的暴力美学,够惊艳、够像未来就行。但到了下半场,专业用户和高频创作者真正需要的,不是一个随时给你惊喜的天才导演,而是一个足够听话、可以调参数、可以反复修改、能够稳定执行意图的数字劳动力。不是只会“生成”,而是要会“响应”。
第二道门槛,是成本。 在上半场,算力是被浪漫叙事遮住的背景板;到了下半场,算力会直接写进产品的生死簿。谁的效果更好当然重要,但如果成本打不下来、资源吃得太重、使用体验又不够频繁,产品就会很快被放回资源配置表里审视。Sora 今天最刺痛行业的地方,也正在于此:它证明了上限,却没能守住商业闭环的下限。
第三道门槛,是承接能力。 视频生成真正难的,从来不是那一下“做出来”,而是做出来之后怎么办:创作者工作流能不能接进去,普通用户能不能快速上手,内容审核和版权风险能不能控制,用户会不会反复回来,平台能不能形成稳定留存。
说得更直白一点:
Sora 让大家第一次看见了神迹。到了今天,行业开始问的是:这场神迹到底能不能稳定、可控、低成本地重复发生。
为什么平台型玩家开始上桌
当评价主角的标准从“技术奇观”变成“基础设施”,市场的目光自然会转向那些擅长组织能力的平台型玩家。在这套新的坐标系里,PixVerse已经成为了一个值得解剖的典型样本。
先看可控性。相比只强调“一键出片”的展示逻辑,PixVerse 后续明显在往更强交互、更强响应的方向推进。无论是早期通过模板把复杂生成能力翻译给普通用户,还是后来高频次的模型迭代,一步步完成首个5s生成、首个音视频直出等能力的进化,核心都是在寻求让用户对内容的高效获取和高掌控力。
再看成本。对于平台型玩家来说,自研模型并不只是为了证明自己也有底层能力,更关键的是把训练效率、推理成本和迭代主动权掌握在自己手里,再把成本的优势反哺给用户。在常态化情况下,PixVerse 720p 视频生成价格已经压到每秒 0.04 美元。

最后看承接能力。PixVerse 把视频生成从少数专业用户的工具,慢慢翻译成更广泛用户都能上手的产品。模板、工作流、轻量化交互,这些看起来不够性感的设计,反而可能是平台成立的核心。PixVerse 也是少有同时押注 C 端和 B 端的玩家。它比 Sora 更早推出 App,提前去抢 C 端入口。同时,模型能力的迭代也一直稳在第一梯队。同榜单里,和它并列的往往都是大厂模型,但 PixVerse 平均每月使用的训练资源不到千卡,成本只有同行的十分之一。
这种路径是不是成立,其实也已经能从几个维度看出端倪。
首先是全球资本与市场的权威背书。 在 a16z 发布的《Top 100 Gen AI Consumer Apps》第五版中,PixVerse 成功从观察名单进入正式榜单。而在 2026 年 3 月的第六版中,a16z 明确指出 PixVerse 已经建立起“真实的牵引力”(Real Traction)。相比之下,由于缺乏持续的应用承接,Sora 未能进入这一版的移动榜单。

其次是极为硬核的用户行为数据。 根据 Similarweb 的监测显示,PixVerse 的 Bounce Rate(跳出率)显著低于 Sora。这意味着用户进入后,不是“看一眼就走”,而是产生了更深度的互动与创作。谢旭璋在访谈中对此给出了更深层的解释:PixVerse 通过模板和工作流设计,让用户留了下来。截至 2025 年 10 月,其全球总用户数已超 1 亿,月活(MAU)突破 1600 万,30 日留存远超行业平均水平。

最后是向“视频引擎”进化的平台潜力。 PixVerse R1 展现出的“实时生成”与“无限画面”,实际上已经超越了传统视频生成的范畴。谢旭璋曾经有过解释:他们为什么会投 R1,不是为了蹭“世界模型”这个概念,而是因为他们判断,未来视频和游戏的边界会越来越模糊。一旦视频变得能交互,全新的内容、用户和创作机会就会出现,所以必须提前布局。
这种“平台型玩家”不靠长期组织能力。它们更关注那些看起来不那么性感,却决定生死的资产:API 稳定性、工作流封装以及对 90% 普通用户创作欲的精准捕捉。
预告片结束,正片开始
回头看,Sora 更像是 AI 视频时代的一支超长预告片。
它完成了它的历史使命——让全世界第一次相信,机器生成的未来可以如此真实。但预告片再震撼,也不等于正片。真正决定一个行业上限的,是谁能把震撼变成服务,把能力变成产品,把模型变成平台。
Sora 让我们看见了未来,而接下来的玩家们,则要负责把未来做成日常。

稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。


