26年4月17日，全球AI资讯约15条：高德已拿下具身智能领域15项世界第一、OpenAI 收购 Hiro、它石智航Pre-A轮融资4.55亿美金等

发布时间：2026-04-16来源：新智讯

关注后加星: 早上七点钟, 全球AI动态在手中

昨日，AI领域发生了多项重要事件和进展，共计约15条汇总如下。

AI应用进展和演化

1-1. 短短3个月，高德已拿下具身智能领域15项世界第一

高德在具身智能领域实现惊人突破：其Abot-world系列世界模型已斩获15项国际权威评测第一，并在Agibot World Challenge与World Arena两大顶级榜单登顶，力压Google、NVIDIA等国际巨头。该模型最大亮点是能“看懂物理”——不仅能准确预测物体滑动、倾倒、堆叠、流体变化等复杂动态，还能保持多步因果逻辑连贯性，大幅提升机器人对未知场景的理解与安全执行能力。

此前今年2月，高德发布的ABot-M0（操作）和ABot-N0（导航）两大基座模型，已拿下11项评测第一，实现全球首个“双SOTA”。目前，Abot-world还在PBench、EZSbench等主流基准中稳居榜首。更令人期待的是，高德首款四足机器人即将发布，标志着其正从算法突破加速迈向硬件落地。
https://www.qbitai.com/2026/04/401649.html

1-2. 继HappyHorse后，阿里又有一款模型登顶权威评测榜单

阿里最新推出的“ABot-PhysWorld”世界模型，近日登顶全球权威评测榜单WorldArena，成为继4月初“HappyHorse”登顶Artificial Analysis后，半个月内阿里第二款问鼎世界级榜单的AI模型。WorldArena由清华等8所顶尖高校联合打造，评测体系覆盖16项核心指标和3大真实任务，堪称世界模型领域的“高考”。

ABot-PhysWorld在物理规律理解、长程动态预测（如物体滑动）等方面表现突出，多步因果推理准确率超82%（领先GigaWorld约9个百分点，超Google Veo约14个百分点），远超多数仅能生成短时静态视频的竞品。它不仅能“看懂”物理世界，更能“推演”未来几秒的交互结果，为机器人任务规划、工业异常预警、自主决策等落地场景提供真正可用的能力。
https://www.qbitai.com/2026/04/401554.html

1-3. 全球首创16cm极致外扩超级机械臂，MOVA扫地机开启清洁新纪元

MOVA V70 Ultra扫地机器人以“16cm极致外扩超级机械臂”为核心突破，彻底改写清洁逻辑——它不再依赖机身钻入死角，而是让拖布像人手一样主动伸进5.9厘米的狭窄内凹空间（如沙发底、弧形桌腿），边缘覆盖率达普通拖把的3倍以上；搭配12cm外扩边刷机械臂，实现“拖布能到哪、边刷就扫到哪”的双主动伸入式清洁。

同时首创0耗材集尘仓（100天免倒尘、可水洗烘干）和护芯闪充技术（充电提速30%）。背靠超3000项全球专利、70%研发人员占比，MOVA坚持原创技术路线，2025年营收暴增418%，海外收入占比超80%，全球扫地机业务收入突破20亿元。从德国西南欧严苛市场首发可见，MOVA正从清洁单品迈向以自研AI芯片为底座的“家庭贾维斯”系统生态。
https://www.qbitai.com/2026/04/401512.html

1-4. 谷歌悄悄加了个按钮，Gemini长出手脚变打工人！三巨头抢着教AI干活

谷歌正将Gemini从“会聊天的AI”升级为“能干活的AI”。近日，其产品界面悄然新增「Agents」一级入口（与Chat、Gems并列），标志着Gemini正式迈入Agent时代——用户无需代码，即可在可视化界面中新建任务、设定目标、连接Gmail/Drive/Jira等20+工具、上传文件，甚至添加“人工审核”节点。

数据显示，Agent Designer已随Gemini Enterprise全面上线，支持多步工作流编排与定时自动执行；NotebookLM新增音视频摘要，Chrome侧边栏集成Auto Browse实现AI代操作浏览器。这背后是谷歌“全栈分发”战略：依托20亿+用户基础，把Agent能力嵌入Workspace、Search、Cloud等现有产品，让普通人拖拽即可创建AI员工。
https://www.163.com/dy/article/KQKJQOF10511ABV6.html

1-5. 豆包正式推出全球首个规模化落地的原生全双工语音大模型

Seeduplex彻底告别传统“你说完我再说”的半双工模式，实现真正“边听边说”，让用户可随时插话、打断，AI也能实时倾听、智能判停。实测显示：误打断率降低50%，抢话概率下降40%，对话流畅度MOS分提升12%。

其核心突破在于全局声学感知（抗噪强）和动态判停技术（结合语速、语调、语义判断用户是否思考或说完），让AI有了“活人感”。目前Seeduplex已全量接入豆包App——该应用月活达1.72亿（QuestMobile 2025年9月数据），日均Token调用量超120万亿（较2024年增长1000倍），为技术迭代提供海量真实数据支撑。同时，Seeduplex正加速赋能智能座舱，已搭载于赛力斯、吉利等20+车企，别克至境E7实测语音识别准确率达98%。
https://www.chinaz.com/2026/0416/1746883.shtml

AI大模型算法、赛事和会议

2-1. 永别了，背公式时代！波兰物理学家用一个算子统一数学

波兰物理学家奥德尔齐沃莱克提出，仅用一个简单二元算子 eml(x, y) = eˣ − ln(y)，通过不同层数的自我嵌套（即“套娃式”调用），就能完全生成所有初等函数——包括 sin、cos、ln、√x、xʸ、π、e、i，甚至加法（x+y）！例如：
- 指数函数：eml(x,1) = eˣ；
- 自然常数 e：eml(1,1) = e；
- 圆周率 π：需5层嵌套；
- 虚数单位 i：需6层。

该成果堪比计算机中的“与非门”（NAND）——单个逻辑门即可构建全部数字电路。它揭示：看似庞杂的初等数学，并非由几十个独立公式构成，而是同一底层结构的涌现结果。这挑战了“数学越学越繁”的直觉，暗示宇宙的数学根基可能极度简洁——一行代码，无限折叠，万物生长。
https://www.163.com/dy/article/KQKRSSOT0511ABV6.html

2-2. 北大联合Llama-Factory推出DataFlex：工业级数据动态训练系统

大模型训练已进入“数据深水区”：参数调优不再是瓶颈，真正决定性能的是——模型看什么数据、看多少次、优先学哪些样本。北大推出开源框架 DataFlex，首次将“数据调度”系统化、工程化。它不是一堆算法脚本，而是基于 LLaMA-Factory 构建的统一训练基础设施，支持动态样本选择、动态数据混合、动态样本加权三大能力，让数据像模型参数一样可配置、可优化、可复现。

实验表明：在 Mistral-7B 和 Llama-3.2-3B 上，动态方法平均提升准确率超2%；DoReMi/ODM 动态配比使困惑度下降、通用评测准确率提高；LESS 方法在单卡训练中提速5%，8卡下加速达57%。DataFlex 零成本迁移、YAML一键配置，已登顶 Hugging Face 月度论文榜。
https://www.36kr.com/p/3767583273829125

AI人才和资本动态

3-1. 它石智航Pre-A轮融资4.55亿美金破中国具身智能纪录，高瓴红杉美团联合领投

它石智航近日完成超4.55亿美元Pre-A轮融资，创中国具身智能领域单轮最高纪录（此前天使轮2.42亿美元已破纪录），成立仅一年即跃居行业第一梯队。本轮融资超募，获“四维资本”强力加持：高瓴创投与红杉中国联合领投；美团战投重金加码并持续领投；TCL产投、首程控股等10余家产业资本入局；北京、上海两大国有机器人基金首次联手投资具身智能企业——凸显国家层面对该赛道的战略重视。

技术上，它石率先攻克工业界公认的难题——复杂柔性线束装配，创下吉尼斯世界纪录（1小时内完成亚毫米级线束装配次数最多）；其自研通用具身大模型AWE3.0已是全球首个“能干活”的物理AI模型。公司坚持全栈自研，聚焦“数据—模型—本体—场景”闭环落地。
https://www.leiphone.com/category/industrynews/0rE9sWGSXjUMbNay.html

3-2. 智象未来完成超5亿元新一轮融资，全力打造下一代原生全模态世界模型

智象未来（HiDream.ai）是一家深耕AIGC领域超10年的中国AI领军企业，近期完成超5亿元新一轮融资。公司以“原生全模态世界模型”为技术核心，突破性融合AI视频生成（如全球首个开放DiT架构视频模型）、具身智能与微观模拟，构建能统一理解、推演和生成物理世界的下一代AI底座。

技术实力扎实：开源图像模型HiDream-I1上线24小时登顶Artificial Analysis全球榜首；图像编辑模型HiDream-E1.1多项指标超越Flux.1；模型全球下载超200万次。商业化成效显著：覆盖3000万专业用户、4万家企业，2026年Q1营收已超2025全年；HiBurst成TikTok官方前五大AI伙伴，vivago.ai单月新增用户破千万，“帧赞”AI影视智能体已制作短漫剧超5000分钟。
https://view.inews.qq.com/k/20260416A02UQT00

3-3. 睿禾健康（ReHealth AI）完成400万元种子轮融资

睿禾健康（ReHealth AI）是一家2025年成立的预防医疗AI公司。其核心突破在于打造全球首个“预防效果可结算”的AI平台——不只预测疾病（如心脑血管风险，AUC达0.84），更通过PSM归因分析，将预防干预的效果量化、可核查，并直接对接医保或商保支付系统，破解行业长期痛点：“预防有效，却无法收费”。

目前，平台已实现预测—干预—归因—结算验证的完整闭环工程化落地。首期聚焦心脑血管病，为医院、保险公司和企业客户提供B端服务；个体风险模型可提前3–5年预警，支持精准分层干预。本轮资金将用于临床回顾性测试、二类医疗器械软件申报、算法备案等关键合规路径。公司计划快速复制模式至糖尿病、慢阻肺、肿瘤筛查等高赔付慢性病领域。
https://m.36kr.com/p/3750864272933377

3-4. OpenAI 收购 Hiro：一个 10 人团队的消失，与 2000 亿美元个人金融市场的真正入口

这是一笔看似微小、实则意味深长的收购：成立仅2年、团队仅10人的理财初创公司Hiro Finance，被OpenAI低调收购后迅速关停产品、清空数据。表面看是典型的“acqui-hire”（人才收购），但背后信号强烈——AI正从“帮你查资料”迈向“替你做决策”。

Hiro的核心突破不在算法多强，而在于用自然语言交互做可解释的财务推演（如“如果失业3个月，我的储蓄还能撑多久？”），并清晰展示计算逻辑，直击金融领域最敏感的痛点：信任。它验证了用户愿意把真实财务数据交予AI的前提，是“看得懂、信得过”。这笔收购不为产品，而是为能力：可验证的推理、高信任场景的落地方法、以及将复杂决策压缩进日常对话的技术路径。
https://aitntnews.com/newDetail.html?newId=24122

AI风险与政策管理

4-1. Claude实名认证引众怒！强制验证是为了更精准封号

Claude近期强制推行实名认证（KYC），要求用户手持身份证、护照或驾照原件拍照验证，引发广泛争议。该政策名义上为合规，实则被用户发现是“封号前置步骤”——验证后账号常被以“疑似未成年”为由直接封禁。Anthropic官方明确将18岁设为使用门槛，远高于OpenAI（13岁）和Gemini（13岁）。

一名15岁程序员因账号被停用，虽获全额退款，却暴露了AI编程正悄然变成“18禁”行业。更令人担忧的是，验证交由第三方Persona处理，其隐私条款显示用户身份证信息可能被17家子供应商接触，并用于训练反欺诈模型，存在永久性身份泄露风险。讽刺的是，Claude自家最强模型Opus 4.6在测试中竟否定了该政策的合理性，直言其“缺乏必要性”。
https://www.qbitai.com/2026/04/401655.html

写在最后

欢迎大家关注、分享、转发本公众号，也欢迎直接与小编联系对接合作～

小问卷：公众号打分点评

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。