27城争夺,54厂竞速,具身智能迎来关键风口
一场围绕“数据”暗战正悄然浮出水面。
近日,四座全新具身智能超级数据工厂官宣落地,宿迁、武汉、自贡、赣州四大坐标集齐,国内具身智能企业「帕西尼感知」再落四子,构建起全国首个覆盖华北、华东、华中、西南、华南的分布式超级数据采集矩阵。
这不仅是一家企业的扩张,更是一个强烈的信号:具身智能的数据采集,正在从实验室的“手工作坊”阶段,迈向工业化的“强泛化”时代。
作为新一轮招商引资和产业布局的“重头戏”,具身数采中心正被各地疯抢——深圳、上海、天津、杭州、苏州、合肥、武汉、赣州等27个城市,正在这场关于“数据定义权”的豪赌中,争抢最好的底牌。
27城竞速
争抢数据底座”的城运之战
先把目光拉升至宏观经济层面,一场颇具深意的角逐正在上演。
2025年,国内具身智能机器人数采中心建设数量呈井喷式增长,一个突出特征是:地域分布不再局限于北京、深圳、上海等一线城市的创新高地,而是呈现出多点开花、向全国蔓延的态势。一批具备战略眼光与产业魄力的新锐城市敏锐地捕捉到这一赛道的战略价值,纷纷以最大的诚意“筑巢引凤”。
山东滨州通过签署开普勒生产制造项目,规划建设省级具身智能数据采集与训练中心;
江西九江凭借创新的“资本招商”模式,成功吸引优必选投资6.5亿元,建成省内首条人形机器人产线及数据采集训练中心,迅速抢占产业高地;
在广西,柳州与防城港两地也先后与优必选签约,联合打造面向区域乃至东盟的具身智能数据采集及测试中心,展现出后发地区布局未来产业的决心......
以帕西尼感知此次宣布点亮的4个工厂为例,赣州工厂是赣州引进的首个具身智能数据采集项目,由一线双币私募机构黄浦江资本引进并投资,这也是江西省引进的第二座具身智能数据采集与训练中心。武汉、宿迁、自贡此前已有至少一个具身智能数据采集训练项目落地,地方政府对这一新兴业态表现出的热情超乎想象。
千机社MilliBOTSociety统计显示,截至发稿前,国内已有超27个城市在具身智能数据采集基础设施上积极布局,建设具身智能机器人数采中心、创新中心、训练场不下54座。

各省具身智能数据采集数采中心/创新中心/训练场数量统计
制图:千机社 | 来源:公开资料整理
对于地方政府而言,引入这样的“超级数据工厂”,其战略意义不亚于十年前引进一座大型制造工厂。
首先,这是新质生产力的“税基”争夺。
数据工厂不仅仅是采集数据,更是高附加值数字产业的集聚核。一个十亿级数据产能的工厂,不但能解决当地成百上千的人口就业,更将带动上下游的传感器制造、数据标注、模型训练、本体制造、零部件等产业聚集,撬动地区经济杠杆,补足机器人产业所稀缺的高成色链条。

国内部分具身智能数据采集工厂--产能统计
制图:千机社 | 来源:公开资料整理
以深圳宝安区为例,2025年,华为云具身智能产业联合创新中心落地于此,并非落子一楼一地,而是宝安区全局性产业部署的关键一环:该中心已吸引锦鹏机器人、奇点工厂、亿嘉和等十余家企业进驻,多个联合创新项目在垂类场景中率先落地,覆盖工业焊接、螺钉装配、油田巡检等垂直领域。
宝安区以此为支点,统筹湾区产业投资大厦、“互联网+”未来科技城、智能机器人灵巧手产业园等多个关键平台,打通从部件打样、算法部署、整机验证到跨行业测试的完整闭环,为机器人企业搭建起产品从验证到出海的快速通道。
其次,这是城市产业升级的“场景供给”。
宿迁的新能源、新材料产业,自贡新型储能产业,武汉的光电子产业,赣州的稀有金属加工,这些城市原本就有深厚的制造业根基。
具身智能数据工厂的落地,可以将这些真实的工业场景转化为机器人的训练场——打破传统数据采集局限于受控环境(In-lab)采集的桎梏,真正做到数据源于场景、用于场景,为具身智能大模型提供更具针对性的“强泛化”燃料。

帕西尼感知五大数据采集工厂场景--战略生态规划
制图:千机社 | 来源:帕西尼感知
借鉴信通院《城市全域数字化转型发展报告(2025年)》中所言,城市全域数字化转型沿“技术-数据-改革-产业”路径释放价值。
最后,这是抢占未来人工智能话语权的“制高点”。
在人工智能时代,数据就是新的石油。谁拥有最大规模、最高质量的真实物理交互数据集,谁就掌握了定义下一代机器人行为标准的权利。帕西尼在CES 2026上展示其全模态数据采集系统时,外界看到的是一家企业的技术实力,而站在其背后的天津、深圳等城市在全球科技版图中竞争力已实现巨量跃升。

54座国内具身智能机器人数采中心及训练场一览图
制图:千机社 | 来源:公开资料整理
作为下一阶段各地招商引资的“重头戏”,具身智能数据底座既是全量数字要素的“操作系统”,也是赋能整体智治的决策枢纽,“向下调度资源、向上调度业务”的筑基赋能定位更加凸显。
各地区正拿出“看家本领”,下场疯抢,通过政策引导、资本撬动与场景开放,将具身智能的数据底座深深嵌入到自身的产业转型蓝图之中,放眼望去,百舸正争流。
100+选手扎堆
具身数据的“四架马车”
无论本体公司还是零部件供应商,纷纷跑步进场布局数据采集,不同的技术路线也逐渐清晰。
目前具身智能数据领域已分化出四条主流技术路线:遥操作采集、仿真合成、互联网视频学习、无本体采集,我们称之为驱动高质量具身智能数据发展的“四驾马车”。

具身智能数据采集的四条主流路线
制图:千机社 | 来源:公开资料整理
以上文提到的帕西尼感知为例,这是【无本体采集(UMI)】路线的典型代表,鹿明机器人、Generalist AI、Sunday Robotics也属于这一路线上的选手。
无本体采集(UMI)践行着“以人为中心”的数据哲学:让人类手持轻便的采集设备(如夹爪、触觉传感终端)直接演示操作,再将采集到的人类手势轨迹通过算法映射到不同构型的机器人上,其颠覆性在于完全摆脱了对昂贵机器人本体的依赖。
帕西尼感知的UMI路线叠加了自研的触觉传感器核心技术,能够采集包含触觉、摩擦力、材质纹理在内的全模态数据,填补了行业在触觉维度的空白。通过真人佩戴PMEC采集手套,帕西尼实现符合人类直觉与真实物理规律的真实数据采集,解决遥操作数据动作不协调、仿真环境存在“模拟到现实鸿沟”的问题,并为模型训练提供具有鲜明物理语境的数据多样性。

帕西尼感知“以人为中心”(Human-Centered)全模态感知高精度实采具身数据体系 | 来源:帕西尼感知
此外还有【遥操作采集】,以Figure AI、宇树科技、智元机器人、星动纪元、星尘智能、越疆科技、灵御智能为代表。这条路线遵循最经典的机器人学习范式,即由人类远程操控真实的机器人本体去执行任务,从而采集包含真实物理交互信息的高质量数据。这种方式的优势在于数据保真度最高,机器人所感知的力矩、关节电流等信号均为真实值,没有信息损耗;但其瓶颈同样突出:硬件成本极其高昂,且数据与特定机器人构型深度绑定,跨本体泛化能力受限。
目前,智元机器人在上海建设了4000平方米的数据采集工厂,日均可产出3万至5万条数据,其开源的AgiBot World数据集已包含超过100万条真实轨迹,成为行业重要的数据资产。
第三条路线是【仿真合成】,以银河通用、光轮智能、枢途科技、跨维智能为代表。这条路线选择绕过物理世界的限制,在仿真引擎中大规模生成虚拟交互数据。其核心逻辑是“用算力换人力”:在仿真环境中,一周即可生成十亿级的交互数据,单条数据的边际成本趋近于零。但这一路线面临着“仿真到现实”的迁移鸿沟,即仿真中完美的物理规律往往与现实世界的复杂噪声存在偏差。
目前,银河通用的训练数据中约90%来自仿真合成,这种“低成本试错”的策略使其在预训练阶段具备了规模优势。
第四条路线是【人类视频学习】,以特斯拉、枢途科技、它石智航、逐际动力、千寻智能、Skild AI为主要实践者。这条路线试图挖掘互联网上海量的人类操作视频这座“金矿”。通过让模型从这些视频中学习视觉常识和动作语义,可以获得远超任何实验室采集规模的先验知识。
不过,视频数据天然缺乏力觉、触觉、力矩等机器人执行任务所必需的控制信号,属于“信息不完备”的学习源。为了补足这一短板,它石智航研发了SenseHub数采套件,通过轻便采集手套搭配全景相机,在保留视频便利性的同时尽可能补全物理交互维度的信息。
需要强调的是,这四条技术路线并非彼此替代的竞争关系,而是在构成一条从“低成本试错”到“高保真精炼”的完整数据供应链。多数头部公司会根据应用场景的差异,组合使用多种数据来源,只是在资源配置与技术重心上各有侧重。
这一多元并存的格局,恰恰反映出具身智能数据基础设施建设仍处于早期探索阶段,远未到收敛统一的时刻。
结语
在一片火热之中,理性的声音同样值得倾听。
毫无疑问,具身智能的竞争,正在从实验室里的算法竞赛转向物理世界中的数据基建竞赛。这些遍布全国的分布式数据采集矩阵,就像一张覆盖在实体经济版图上的感知神经网络,源源不断地将人类的精细动作、触觉感知和物理交互转化为机器人可以理解的数字语言。
我们或许正在迎来数据的“平权时刻”,但对于那些抢先完成“数据定义权”卡位的城市和企业来说,它们已经在这场关于未来的豪赌中,拿到了最好的底牌。
如果将目光放得更长远,百亿条产能的背后,考验我们的将不仅是采集设备的数量,更是对海量数据的清洗、标注与治理能力,没有严格质量管控的“暴力采集”,只会产出大量的数字垃圾,行业需经历从“追求量级”到“数据治理”的转变。
创投圈的下一个风口,也是一个时代的转折。
-END-
本文内容系转载,不为商业用途,如有任何问题,敬请作者与我们联系info@gsi24.com。
推荐关注

