26年4月23日,全球AI资讯约15条:马斯克要用600亿美元拿下Cursor、贝索斯融资100亿美元 押注物理AI等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. 物理优先+VLA闭环进化:高德ABot-World世界模型,破解具身智能零样本泛化难题
高德最新发布的ABot-World世界模型,是具身智能领域的一项重大突破。它不再像Sora、Veo等传统模型那样只追求“画面逼真”,而是首创“物理优先”范式——每生成一帧,不仅输出图像,更同步输出质量、摩擦、接触力等可微分物理状态,真正让AI“懂物理”。
模型采用双引擎架构:ABot-3DGS(基于高德厘米级地图数据+3D高斯泼溅技术)可无限生成高保真、可编程的数字孪生场景;ABot-PhysWorld(14B参数扩散Transformer)则专注动力学推演,支持末端位姿与夹爪状态输入,实现“指令即因果”的精准控制。实测在WorldArena等六大权威榜单中,于物理合规性、动作可控性、零样本泛化三大核心指标全部登顶SOTA——尤其在零样本基准EZSbench上刷新纪录。https://www.qbitai.com/2026/04/404086.html

1-2. 3B激活参数!商汤Sage登顶PinchBench,端侧第一
商汤绝影推出端侧智能体基座模型“Sage”,仅以3B激活参数,在国际权威Agent评测PinchBench中达成94%任务完成率,超越Claude-Opus-4.6(93.3%)、GPT-5.4(90.5%)、Gemini-3(87.0%)等云端大模型。其算力消耗仅为竞品小米MiMo-v2-Pro的1/14,显存占用仅1/31,却反超6.6个百分点——有力打破“只有大模型才能做好Agent”的认知误区。
Sage真正实现了车载场景下的复杂任务闭环:一句“预热车内、导航回家、切换轻松音乐”,即可联动空调、导航、音响系统,首字响应快;还能主动感知儿童就座、拥堵路况并智能干预。背后两大自研技术功不可没:SCOUT(省60%训练算力)加速学习真实用车技能;ERL让多步推理出错可实时修正,复杂任务完成率提升20%。https://www.163.com/dy/article/KR4DGMLI0511ABV6.html
1-3. 无需多视角,单图重建可交互3D模型!南洋理工开源结构推理框架
南洋理工大学团队推出的MonoArt,为3D生成领域带来重要突破:它能让单张照片“长出关节”,生成真正可动、可交互的3D模型(如能开门的冰箱、可折叠的椅子)。传统方法要么依赖多角度视频、庞大模型库,要么需外部先验而MonoArt仅凭一张图,通过四步渐进推理实现端到端可动物体重建。
四步分别是:①用TRELLIS骨干网恢复稳定3D几何;②识别部件并聚类点云特征;③解耦语义(“是什么”)与空间(“转在哪里”)进行运动推理;④输出物理可用参数——关节类型、旋转轴、中心位置、运动范围及部件层级关系。在PartNet-Mobility基准上,MonoArt在7类/46类任务中全面领先,推理仅需20.5秒,远快于Articulate-Anything(229.9秒)等方法。https://www.163.com/dy/article/KR46M3P70511ABV6.html

项目链接:https://lihaitian.com/MonoArt/
1-4. 谷歌真急了!深夜更新Deep Research智能体,支持MCP、原生图表
谷歌正全力加速AI研究智能体的商业化落地。2月19日,其发布全新Gemini 3.1 Pro模型(ARC-AGI-2推理得分77.1%,是前代两倍),并同步推出两款企业级自主研究智能体:Deep Research(重速度)和Deep Research Max(重深度,支持扩展计算,HLE得分54.6%,DeepSearchQA达93.3%)。二者均通过Gemini API以付费预览版开放,暂不向普通用户或Gemini App订阅者开放,引发用户吐槽。
最大突破在于两大能力:一是支持Model Context Protocol(MCP),可安全接入私有数据库与FactSet、标普等专业金融数据源,实现内外信息融合;二是原生生成图表与信息图,告别纯文本报告。这意味着对冲基金或咨询公司能一夜跑完尽调,清晨收到带可视化结论的完整分析。https://www.36kr.com/p/3777298681869061

1-5. 神秘模型「大象」:100B拿下SOTA,Token效率超高!
蚂蚁集团Inclusion AI团队推出的轻量级大模型「Elephant Alpha」正式浮出水面——它仅100B参数、支持256K上下文与32K输出,却在多项实测中表现亮眼:写代码“一次生成、精准修复”,3000字杂乱会议纪要3秒提炼为结构化JSON(含摘要、待办、邮件),CSV数据分析+自检全程仅12秒。
权威测评AI BENCHY显示:平均响应延迟约1秒(竞品10–30秒)、单次输出Token稳定在2500左右、指令遵循一致性高达9.6/10。它不拼参数堆料,专攻“快、准、省”——实测中Token消耗比Gemini-2.5-Flash-Lite低约40%,适合高频办公场景。当然,它暂不擅长超长链规划(如出海战略)或极新知识(如React 18最新API),需配合清晰Prompt或工具协同。https://view.inews.qq.com/k/20260416A0527500

AI大模型算法、赛事和会议
2-1. 全球自动驾驶激战,滴滴与清华走出一条技术新路
滴滴自动驾驶与清华大学李升波教授团队深度合作,推出原创算法STAPO——它像“AI医生”,精准剔除大模型训练中仅约0.01%的错误信号,显著提升自动驾驶决策的稳定性与泛化能力。这项突破不是纸上谈兵,已直接用于端到端无人车模型微调。
背后是双方共建的“深穹远航实验室”,打通论文、代码、车辆、道路的全链路:清华提供顶尖理论与人才(论文引用超2.26万次),滴滴贡献十年积累的真实场景、2100天无事故运营数据及量产能力。目前,滴滴首款Robotaxi量产车R2已交付,关键零部件国产化率超90%,正于北京、广州开展全无人载客测试。滴滴依托日均千万单的主业现金流和混合派单等扎实运营能力,走出一条“稳扎稳打、慢即是快”的中国式路径。https://www.163.com/dy/article/KR46M7MG0511ABV6.html

2-2. 国产多模态Agent拿下医学分割SOTA!不用改模型、不加token | 浙大&上海AI Lab
浙江大学蔡钰祥教授与上海人工智能实验室江彦开团队提出的IBISAgent,被CVPR 2026接收,是一项突破性生物医学图像分割新范式。它直击当前医学大模型的四大痛点:单次推理无力处理细微病灶、隐式分割标记(如<SEG>)损害语言能力、缺乏真实临床式的交互逻辑。
IBISAgent将分割重构为“看—想—点—调”的多步自主决策过程,全程无需新增模块或token,语言与视觉能力完全保留。研究创新性构建45.6万条高质量自动轨迹数据(基于340万图像-mask对+Gemini-2.5-Pro推理),并引入两阶段训练:冷启动监督微调(SFT)+细粒度强化学习(RL)。在三大权威测试集上,其平均IoU达80.61(较基线提升35.13%),交互步数从11.29大幅压缩至4.26步。https://aitntnews.com/newDetail.html?newId=24311
论文链接:
AI人才和资本动态
3-1. 前小鹏汽车自动驾驶一号位李力耘出任众擎CTO,加速打造具身大脑
近日,前小鹏汽车自动驾驶“一号位”、副总裁李力耘正式加盟人形机器人公司众擎,出任首席技术官(CTO)。这位41岁的清华本硕、纽约大学博士,曾带领超千人团队推动小鹏智驾从规则驱动迈向AI大模型时代,并深度参与百度Apollo等前沿AI项目。中国具身智能融资火热,仅众擎本月就完成2亿美元融资
众擎正加速构建“具身大脑”技术体系:以多模态感知为输入,融合“本体(硬件)+小脑(运动控制)+大脑(决策推理)+神经末梢(实时响应)”的全集成架构。相比纯学术路线,李力耘带来的正是自动驾驶领域已验证的“工业化AI”打法——高效数据飞轮、强工程部署能力与规模化落地经验。业内认为,这将显著缩短人形机器人从实验室走向工厂、家庭的进程。https://www.qbitai.com/2026/04/404124.html

3-2. 把人类驾驶员赶出机场,复旦大牛校友要港股IPO了
驭势科技——专注机场与厂区的“AI司机”,正冲刺港股IPO。这家公司不搞热闹的Robotaxi(无人出租车),而是深耕封闭场景:为全球机场提供L4级无人驾驶解决方案,包括行李牵引车、摆渡车、巡逻车等。它是全球唯一专注机场大型商业运营L4自动驾驶的供应商,已落地17个中国机场、3个海外机场(含香港、卡塔尔),机场场景市占率超90%。
2025年上半年营收9865万元,三年半累计营收约5.9亿元,但尚未盈利(累计亏损约7.85亿元)。核心靠自研U-Drive®操作系统(已迭代至5.0版),累计无人行驶里程达900万公里,服务249家客户,含35家世界/中国500强企业。团队源自英特尔中国研究院,CEO吴甘沙为复旦校友。https://www.163.com/dy/article/KR1VAMQM0511DSSR.html
3-3. 马斯克祭出「霸王条款」!Cursor焊死SpaceX战车,600亿砸穿OpenAI
马斯克再放大招:SpaceX以“600亿美元收购”或“100亿美元合作”为条件,将AI编程明星公司Cursor深度绑定。这并非普通并购,而是IPO前的关键叙事——SpaceX正筹备史上最大IPO(估值1.75万亿美元,融资750亿美元),急需强化AI故事。
Cursor虽增长惊人(2026年4月估值超500亿美元,年收入20亿美元,日活破100万),却无自研基础模型;xAI则因11位联合创始人全部离职而陷入重建。双方一拍即合:xAI提供数万张芯片算力,助Cursor训练自研模型Composer;Cursor则补足SpaceX在AI产品端的短板。表面是“买或租”的霸王条款,实则是马斯克“算力+模型+产品+太空基建+资本故事”五盘大棋的闭环一环。https://www.163.com/dy/article/KR46M5Q00511ABV6.html

3-4. 曝贝索斯融资100亿美元,押注物理AI
贝索斯新创AI公司Project Prometheus正引发全球关注:这家成立于2025年的“物理AI”企业,最新获100亿美元融资(约合人民币682亿元),估值飙升至380亿美元(约2592亿元),成为全球资金最雄厚的早期AI公司之一——累计融资达162亿美元(首轮62亿+本轮100亿)。它由贝索斯与顶尖科学家维克·巴贾杰联合创办,两人均出任CEO,团队已近百人,核心成员来自OpenAI。
与ChatGPT等大模型不同,Project Prometheus不主打语言生成,而是专注让AI“理解物理世界”:通过仿真与试错,赋能航空航天、汽车制造等硬科技领域。这一路线高度契合贝索斯长期布局的太空与工程愿景。摩根大通、贝莱德等顶级金融机构参投,印证资本市场对“物理AI”的强烈信心。https://www.36kr.com/p/3776444365226752

3-5. 清华姚班到全球 3D AI 第一:胡渊鸣Meshy ARR 超 4000 万美元
清华姚班出身、MIT博士胡渊鸣创办太极图形,早期屡次转型受挫——用户不愿为专业3D工具付费,却直言:“一个5块钱卖模型,我买!”2022年,团队果断转向,6小时内上线首个AI生成3D模型产品Meshy。
虽初版粗糙(曾产出“四脸怪物”),却意外在恐怖游戏等容错率高的场景找到突破口。此后,Meshy聚焦“能进工作流”而非“最完美”,快速渗透独立游戏、环境素材、3D打印、教育等领域。截至2026年,其ARR达3亿元人民币,全球用户超1000万,美欧市占率超60%,月增速稳定在20%–30%,超半数增长来自自然流量。它证明:AI生成3D已不只是技术概念,而是正在落地的生产力革命。https://view.inews.qq.com/k/20260421A06FT200

AI风险与政策管理
4-1. Anthropic开始抢科学家了?周薪2.7万驻场,专治Claude专家级错误
Anthropic正以“科学家驻场”方式攻克AI科研最大瓶颈——科学判断力。其新推出的STEM Fellow项目,高薪(每周3800美元)、全职(3个月)、驻场(旧金山等地),大规模招募物理、材料、气候、生物等领域的科学家,不要求会机器学习,但必须具备扎实的专业直觉和纠错能力。
例如,有材料学家发现Claude误判相稳定性,便设计专用评测流程;气候科学家则把大气模型接入Claude,构建可调用工具的科研环境。这并非让科学家“用AI做研究”,而是请他们当AI的“高级审校”。此举标志着Anthropic科研战略三步跃迁:从2024年聚焦安全的AI Safety Fellows,到2025年发放API支持科研的AI for Science,再到如今把科学家请进办公室共建模型能力。https://www.163.com/dy/article/KR3NCJGV0511ABV6.html

写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
