26年4月17日,全球AI资讯约15条:高德已拿下具身智能领域15项世界第一、OpenAI 收购 Hiro、它石智航Pre-A轮融资4.55亿美金等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. 短短3个月,高德已拿下具身智能领域15项世界第一
高德在具身智能领域实现惊人突破:其Abot-world系列世界模型已斩获15项国际权威评测第一,并在Agibot World Challenge与World Arena两大顶级榜单登顶,力压Google、NVIDIA等国际巨头。该模型最大亮点是能“看懂物理”——不仅能准确预测物体滑动、倾倒、堆叠、流体变化等复杂动态,还能保持多步因果逻辑连贯性,大幅提升机器人对未知场景的理解与安全执行能力。
此前今年2月,高德发布的ABot-M0(操作)和ABot-N0(导航)两大基座模型,已拿下11项评测第一,实现全球首个“双SOTA”。目前,Abot-world还在PBench、EZSbench等主流基准中稳居榜首。更令人期待的是,高德首款四足机器人即将发布,标志着其正从算法突破加速迈向硬件落地。https://www.qbitai.com/2026/04/401649.html

1-2. 继HappyHorse后,阿里又有一款模型登顶权威评测榜单
阿里最新推出的“ABot-PhysWorld”世界模型,近日登顶全球权威评测榜单WorldArena,成为继4月初“HappyHorse”登顶Artificial Analysis后,半个月内阿里第二款问鼎世界级榜单的AI模型。WorldArena由清华等8所顶尖高校联合打造,评测体系覆盖16项核心指标和3大真实任务,堪称世界模型领域的“高考”。
ABot-PhysWorld在物理规律理解、长程动态预测(如物体滑动)等方面表现突出,多步因果推理准确率超82%(领先GigaWorld约9个百分点,超Google Veo约14个百分点),远超多数仅能生成短时静态视频的竞品。它不仅能“看懂”物理世界,更能“推演”未来几秒的交互结果,为机器人任务规划、工业异常预警、自主决策等落地场景提供真正可用的能力。https://www.qbitai.com/2026/04/401554.html

1-3. 全球首创16cm极致外扩超级机械臂,MOVA扫地机开启清洁新纪元
MOVA V70 Ultra扫地机器人以“16cm极致外扩超级机械臂”为核心突破,彻底改写清洁逻辑——它不再依赖机身钻入死角,而是让拖布像人手一样主动伸进5.9厘米的狭窄内凹空间(如沙发底、弧形桌腿),边缘覆盖率达普通拖把的3倍以上;搭配12cm外扩边刷机械臂,实现“拖布能到哪、边刷就扫到哪”的双主动伸入式清洁。
同时首创0耗材集尘仓(100天免倒尘、可水洗烘干)和护芯闪充技术(充电提速30%)。背靠超3000项全球专利、70%研发人员占比,MOVA坚持原创技术路线,2025年营收暴增418%,海外收入占比超80%,全球扫地机业务收入突破20亿元。从德国西南欧严苛市场首发可见,MOVA正从清洁单品迈向以自研AI芯片为底座的“家庭贾维斯”系统生态。https://www.qbitai.com/2026/04/401512.html

1-4. 谷歌悄悄加了个按钮,Gemini长出手脚变打工人!三巨头抢着教AI干活
谷歌正将Gemini从“会聊天的AI”升级为“能干活的AI”。近日,其产品界面悄然新增「Agents」一级入口(与Chat、Gems并列),标志着Gemini正式迈入Agent时代——用户无需代码,即可在可视化界面中新建任务、设定目标、连接Gmail/Drive/Jira等20+工具、上传文件,甚至添加“人工审核”节点。
数据显示,Agent Designer已随Gemini Enterprise全面上线,支持多步工作流编排与定时自动执行;NotebookLM新增音视频摘要,Chrome侧边栏集成Auto Browse实现AI代操作浏览器。这背后是谷歌“全栈分发”战略:依托20亿+用户基础,把Agent能力嵌入Workspace、Search、Cloud等现有产品,让普通人拖拽即可创建AI员工。https://www.163.com/dy/article/KQKJQOF10511ABV6.html

1-5. 豆包正式推出全球首个规模化落地的原生全双工语音大模型
Seeduplex彻底告别传统“你说完我再说”的半双工模式,实现真正“边听边说”,让用户可随时插话、打断,AI也能实时倾听、智能判停。实测显示:误打断率降低50%,抢话概率下降40%,对话流畅度MOS分提升12%。
其核心突破在于全局声学感知(抗噪强)和动态判停技术(结合语速、语调、语义判断用户是否思考或说完),让AI有了“活人感”。目前Seeduplex已全量接入豆包App——该应用月活达1.72亿(QuestMobile 2025年9月数据),日均Token调用量超120万亿(较2024年增长1000倍),为技术迭代提供海量真实数据支撑。同时,Seeduplex正加速赋能智能座舱,已搭载于赛力斯、吉利等20+车企,别克至境E7实测语音识别准确率达98%。https://www.chinaz.com/2026/0416/1746883.shtml

AI大模型算法、赛事和会议
2-1. 永别了,背公式时代!波兰物理学家用一个算子统一数学
波兰物理学家奥德尔齐沃莱克提出,仅用一个简单二元算子 eml(x, y) = eˣ − ln(y),通过不同层数的自我嵌套(即“套娃式”调用),就能完全生成所有初等函数——包括 sin、cos、ln、√x、xʸ、π、e、i,甚至加法(x+y)!例如:
- 指数函数:eml(x,1) = eˣ;
- 自然常数 e:eml(1,1) = e;
- 圆周率 π:需5层嵌套;
- 虚数单位 i:需6层。
该成果堪比计算机中的“与非门”(NAND)——单个逻辑门即可构建全部数字电路。它揭示:看似庞杂的初等数学,并非由几十个独立公式构成,而是同一底层结构的涌现结果。这挑战了“数学越学越繁”的直觉,暗示宇宙的数学根基可能极度简洁——一行代码,无限折叠,万物生长。https://www.163.com/dy/article/KQKRSSOT0511ABV6.html


2-2. 北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统
大模型训练已进入“数据深水区”:参数调优不再是瓶颈,真正决定性能的是——模型看什么数据、看多少次、优先学哪些样本。北大推出开源框架 DataFlex,首次将“数据调度”系统化、工程化。它不是一堆算法脚本,而是基于 LLaMA-Factory 构建的统一训练基础设施,支持动态样本选择、动态数据混合、动态样本加权三大能力,让数据像模型参数一样可配置、可优化、可复现。
实验表明:在 Mistral-7B 和 Llama-3.2-3B 上,动态方法平均提升准确率超2%;DoReMi/ODM 动态配比使困惑度下降、通用评测准确率提高;LESS 方法在单卡训练中提速5%,8卡下加速达57%。DataFlex 零成本迁移、YAML一键配置,已登顶 Hugging Face 月度论文榜。https://www.36kr.com/p/3767583273829125

AI人才和资本动态
3-1. 它石智航Pre-A轮融资4.55亿美金破中国具身智能纪录,高瓴红杉美团联合领投
它石智航近日完成超4.55亿美元Pre-A轮融资,创中国具身智能领域单轮最高纪录(此前天使轮2.42亿美元已破纪录),成立仅一年即跃居行业第一梯队。本轮融资超募,获“四维资本”强力加持:高瓴创投与红杉中国联合领投;美团战投重金加码并持续领投;TCL产投、首程控股等10余家产业资本入局;北京、上海两大国有机器人基金首次联手投资具身智能企业——凸显国家层面对该赛道的战略重视。
技术上,它石率先攻克工业界公认的难题——复杂柔性线束装配,创下吉尼斯世界纪录(1小时内完成亚毫米级线束装配次数最多);其自研通用具身大模型AWE3.0已是全球首个“能干活”的物理AI模型。公司坚持全栈自研,聚焦“数据—模型—本体—场景”闭环落地。https://www.leiphone.com/category/industrynews/0rE9sWGSXjUMbNay.html

3-2. 智象未来完成超5亿元新一轮融资,全力打造下一代原生全模态世界模型
智象未来(HiDream.ai)是一家深耕AIGC领域超10年的中国AI领军企业,近期完成超5亿元新一轮融资。公司以“原生全模态世界模型”为技术核心,突破性融合AI视频生成(如全球首个开放DiT架构视频模型)、具身智能与微观模拟,构建能统一理解、推演和生成物理世界的下一代AI底座。
技术实力扎实:开源图像模型HiDream-I1上线24小时登顶Artificial Analysis全球榜首;图像编辑模型HiDream-E1.1多项指标超越Flux.1;模型全球下载超200万次。商业化成效显著:覆盖3000万专业用户、4万家企业,2026年Q1营收已超2025全年;HiBurst成TikTok官方前五大AI伙伴,vivago.ai单月新增用户破千万,“帧赞”AI影视智能体已制作短漫剧超5000分钟。https://view.inews.qq.com/k/20260416A02UQT00

3-3. 睿禾健康(ReHealth AI)完成400万元种子轮融资
睿禾健康(ReHealth AI)是一家2025年成立的预防医疗AI公司。其核心突破在于打造全球首个“预防效果可结算”的AI平台——不只预测疾病(如心脑血管风险,AUC达0.84),更通过PSM归因分析,将预防干预的效果量化、可核查,并直接对接医保或商保支付系统,破解行业长期痛点:“预防有效,却无法收费”。
目前,平台已实现预测—干预—归因—结算验证的完整闭环工程化落地。首期聚焦心脑血管病,为医院、保险公司和企业客户提供B端服务;个体风险模型可提前3–5年预警,支持精准分层干预。本轮资金将用于临床回顾性测试、二类医疗器械软件申报、算法备案等关键合规路径。公司计划快速复制模式至糖尿病、慢阻肺、肿瘤筛查等高赔付慢性病领域。https://m.36kr.com/p/3750864272933377
3-4. OpenAI 收购 Hiro:一个 10 人团队的消失,与 2000 亿美元个人金融市场的真正入口
这是一笔看似微小、实则意味深长的收购:成立仅2年、团队仅10人的理财初创公司Hiro Finance,被OpenAI低调收购后迅速关停产品、清空数据。表面看是典型的“acqui-hire”(人才收购),但背后信号强烈——AI正从“帮你查资料”迈向“替你做决策”。
Hiro的核心突破不在算法多强,而在于用自然语言交互做可解释的财务推演(如“如果失业3个月,我的储蓄还能撑多久?”),并清晰展示计算逻辑,直击金融领域最敏感的痛点:信任。它验证了用户愿意把真实财务数据交予AI的前提,是“看得懂、信得过”。这笔收购不为产品,而是为能力:可验证的推理、高信任场景的落地方法、以及将复杂决策压缩进日常对话的技术路径。https://aitntnews.com/newDetail.html?newId=24122

AI风险与政策管理
4-1. Claude实名认证引众怒!强制验证是为了更精准封号
Claude近期强制推行实名认证(KYC),要求用户手持身份证、护照或驾照原件拍照验证,引发广泛争议。该政策名义上为合规,实则被用户发现是“封号前置步骤”——验证后账号常被以“疑似未成年”为由直接封禁。Anthropic官方明确将18岁设为使用门槛,远高于OpenAI(13岁)和Gemini(13岁)。
一名15岁程序员因账号被停用,虽获全额退款,却暴露了AI编程正悄然变成“18禁”行业。更令人担忧的是,验证交由第三方Persona处理,其隐私条款显示用户身份证信息可能被17家子供应商接触,并用于训练反欺诈模型,存在永久性身份泄露风险。讽刺的是,Claude自家最强模型Opus 4.6在测试中竟否定了该政策的合理性,直言其“缺乏必要性”。https://www.qbitai.com/2026/04/401655.html

写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
