深度|说在群核IPO,看起来对 vs 物理上对:AI下半场最关键的路线之争

4月20日,“全球空间智能第一股”群核科技股价继续大涨,收盘报37.56港元,盘中一度升至39.50港元,创上市以来新高。按发行价7.62港元计算,收盘价较发行价累计上涨约393%。根据招股书披露的全球发售完成后总股本约17.00亿股计算,对应总市值约638.6亿港元。此前公开发售阶段,群核科技获约1590.56倍超额认购;上市首日高开约171.7%,收盘涨幅约144.1%。

资本市场的热捧往往映射产业底层逻辑的演变。从李飞飞创立的 World Labs 发布 Marble,推动世界模型从内容生成走向可生成、编辑与模拟 3D 世界,到 Google 的 Gemini 3 强化多模态推理、视觉与空间理解,再到 NVIDIA 持续推进 Cosmos 世界基础模型平台、加速合成数据生成与 physical AI 推理,AI 的发展重心正从理解语言,进一步走向理解、建模和交互物理世界。
这条赛道的底层逻辑是什么?群核科技为何能脱颖而出?本文将剖析空间智能的演进脉络,并探讨群核在其中的定位。
写诗比端水容易:AI的物理瓶颈
过去三年,大语言模型(如GPT-4)主导了AI叙事,它们在文本处理和逻辑推理上超越人类平均水平,能轻松生成诗词或文章。但让AI驱动的机械臂平稳端起一杯水,却仍极具挑战。
端水看似简单,却需要处理海量非语言信息:水杯的三维坐标、抓握角度、力矩、摩擦系数,甚至水重心的动态偏移。这些物理参数无法从互联网文本语料中推导出来。大语言模型的核心是学习符号的统计概率,因此它知道水杯常与桌子关联,却不懂重力、碰撞或材质的真实反馈。
群核科技董事长黄晓煌用形象的方式描述了这种差距:机器人仅仅是抓起一个陶瓷杯子,就需要模型先估算它的体积、再乘以陶瓷密度来推测质量——“但这种猜测肯定有误差,物理世界的信息是无穷无尽的,除了质量、摩擦力,还有是否会变形、不同温度下的软硬变化,非常复杂。”
人类认知从三维空间起步。婴儿先感知深度、抓握物体,再习得语言。数字世界的演进顺序却恰恰相反:从文字到图像、视频,三维空间排在最后。AI的训练数据也如此:海量文本、大量图像、部分视频,却缺乏真正的三维空间数据。
这个倒序揭示了AI从语言智能向空间智能转型的必然性。而转型的核心难题在于:高质量的三维数据不像文本那样遍布互联网,它需要深入嵌入产业流程才能获取。谁掌握了物理正确的三维数据,谁就握住了这个时代的石油。
看起来对 vs 物理上对:路线之争
三维数据的获取有两条路径,这构成了赛道上最关键的分歧。
Sora的发布是一个典型例子。它生成的视频在视觉上令人惊艳,却暴露了深层问题:水往高处流,物体穿墙而过,手指莫名消失。这不是瑕疵,而是结构性缺陷——模型通过拟合像素的统计规律,学会了场景看起来像什么,却没有掌握为什么会是这样。
在内容创作领域,视觉逼真或许够用。但在机器人训练、工业数字孪生或建筑施工等场景中,细微偏差就可能导致严重后果。如果机器人在虚拟环境中学习开门,一旦切换到真实场景,门轴的阻力、把手的高度、摩擦系数都会让它失灵。
因此,从2023年开始,群核的战略就是所有模型和工具都紧贴物理世界,要求生成的内容都与物理世界尽可能接近。从产业格局看,这一分歧也体现为中美路线的差异:美国偏重虚拟世界,大模型公司和纯虚拟内容公司居多;中国则因制造业和硬件产业发达,空间智能路线更贴近物理世界。
这就是赛道的核心分歧:一条路追求看起来对,依赖像素数据,适合娱乐和内容生产;另一条路追求物理上对,依赖结构化的物理参数,支撑更严格应用。后者的门槛远高于前者——它需要长期的数据积累、产业嵌入和基于GPU的物理模拟能力。
十五年深耕,把物理世界搬进计算机
群核的故事不是从AI热潮开始的。
创始人黄晓煌曾是英伟达负责CUDA开发的工程师,群核的英文名“Manycore”源自GPU的众核架构。团队早期依托计算机图形学和高性能计算背景,确立了基于GPU算力进行物理世界模拟的研发方向。
2013年,酷家乐上线。作为一款基于GPU渲染的室内设计工具,把渲染时间从几小时压缩到10秒。关键不在于快,而在于它从第一天就选择了一条更难的路:1:1 还原物理尺寸、墙体厚度、光照反射——不是画一张好看的图,而是建一个物理上正确的数字空间。
这个起点决定了此后十五年的方向。当群核将设计平台对接工厂生产线时,物理正确性就不再只是技术追求,而成了生产要求——工业4.0必须确保生产出来的所有东西可以做了一个仿真系统,去模拟生产出来之后的样子,确保它在物理世界里不会出bug。换言之,群核为每一个数字模型赋予了材质、密度、结构强度等物理参数,再到真实世界验证其准确性。
十多年积累下来的,是从数字世界到物理世界的精确映射能力。AI时代到来后,黄晓煌意识到一个更大的可能——能不能把这条路反过来走?看到一个物理世界的东西,用AI把它反推回数字世界?工业4.0是把数字的东西变成物理的东西,而AI时代的新命题则恰恰相反:看到一个物理的东西,用AI将它反推回数字世界。群核的目标,就是打通这两个方向,彻底连接物理世界与数字世界。
到2025年,群核推出Aholo空间智能开放平台,将逐步汇集其空间重建、生成、编辑、理解等底层空间智能能力。从中可以看出,群核的空间模拟是两条腿走路:一边采集、一边生成。空间重建,即以3DGS重建技术为核心,把现实场景 1:1 搬进计算机。空间生成,则类似李飞飞Marble的路径,从零生成符合物理规律的三维环境,此外结合其过往的渲染等能力,则进一步实现对空间的局部编辑、修改。
美团的王兴最近也强调:物理世界的数字化将是AI非常重要的底座。
这是群核去年做的一个选择,群核的空间智能更着重于现实世界的重建模拟,而不是执着于虚拟环境的生成。不止是要视觉真实,更着重于结构参数等物理信息的正确。
理解意味着模型不只是看到一把椅子的像素,而是知道它的尺寸、重量以及能不能坐。真正让这套体系难以复制的,是十五年产业嵌入沉淀下来的壁垒。数据上,群核积累了超过5亿个三维场景和4.8亿个模型,这些不只是视觉素材,还包含尺寸、材质、物理属性、工程规范等结构化信息,和互联网上能抓取到的散乱3D素材完全不同。
基于这些数据,群核自研了空间语言模型和空间生成模型,前者让AI读懂三维物理规则,后者围绕3D构建世界模型。再加上自建的GPU算力底座,形成了“数据喂养模型,模型驱动产品,产品服务产业,产业反哺数据”的闭环。
空间智能的落地:两条线,一个飞轮
李飞飞将空间智能的应用方向归结为两条主线:创意产业和机器智能。群核目前的业务也主要分为两个板块:服务人的三维创意和服务机器智能,围绕“空间”、“空间的一致性”推动技术和产品落地。
在落地空间智能时,群核主要基于GPU高性能计算技术,切入电商、影视、智能体训练等垂直应用场景进行产品研发。
在创意产业侧,酷家乐是其核心的空间设计平台。针对跨境电商领域,公司推出“虚拟棚拍”功能以减少AI生成内容中的“幻觉”现象。此外,群核推出了针对AI视频生成中空间一致性问题的工具,由于其底层数据基于三维表征而非从二维视频反推,该工具主要用于修正生成视频中的物体位置漂移和空间关系失真等问题。
在机器智能侧,群核为具身智能提供合成训练数据,并为工业场景提供数字孪生方案。其底层逻辑在于为机器人提供符合物理规律的虚拟环境进行前期训练。黄晓煌还提到了一个更长远的愿景:群核希望尽快摆脱对存量数据的依赖——“让AI或者智能体自己探索,探索的过程当中就会自己产生数据。”这意味着,当物理正确的虚拟世界足够完备时,AI不再只是被动消费人类标注的数据,而是在模拟器里自我进化。
这两条业务线在内部形成了一套数据循环机制:产业端应用产生真实环境数据,这些数据被用于训练和微调空间模型;模型能力的提升进一步优化产品功能,随后再次投入产业应用中。
这套飞轮也支撑了群核的财务健康度。根据招股书,群核科技2025年实现经调整净利润5712.7万元,毛利率为82.2%,企业客户净收入留存率超100%。黄晓煌对此有一套生存哲学,他从英伟达身上学到了精髓:“先用在游戏,中间靠挖矿续命,最后等来大模型时代。
结语
空间智能赛道尚处于早期,终局未定。但稀缺的不是生成逼真画面的能力,而是理解物理世界的数据与技术积累。当英伟达将“物理AI”作为未来十年战略时,群核已经在这个战壕里深挖了15年,并且如今正与英伟达在具身智能训练等领域并肩作战。
过去一年,“AI颠覆SaaS”的论调盛行,许多垂直公司陷入焦虑。群核的案例带来了启示:酷家乐积累的不只是用户和收入,而是十五年的产业know-how、海量物理数据和全链路理解。通用大模型无法替代它,因为这类数据不在其训练集中。SaaS只是一种商业模式,根本的护城河而在于企业究竟积累了什么。
群核用十五年把物理世界正确地搬进计算机。至于其价值,资本市场已给出答案。

稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。


