26年4月23日，全球AI资讯约15条：马斯克要用600亿美元拿下Cursor、贝索斯融资100亿美元押注物理AI等

发布时间：2026-04-22来源：新智讯

关注后加星: 早上七点钟, 全球AI动态在手中

昨日，AI领域发生了多项重要事件和进展，共计约15条汇总如下。

AI应用进展和演化

1-1. 物理优先+VLA闭环进化：高德ABot-World世界模型，破解具身智能零样本泛化难题

高德最新发布的ABot-World世界模型，是具身智能领域的一项重大突破。它不再像Sora、Veo等传统模型那样只追求“画面逼真”，而是首创“物理优先”范式——每生成一帧，不仅输出图像，更同步输出质量、摩擦、接触力等可微分物理状态，真正让AI“懂物理”。

模型采用双引擎架构：ABot-3DGS（基于高德厘米级地图数据+3D高斯泼溅技术）可无限生成高保真、可编程的数字孪生场景；ABot-PhysWorld（14B参数扩散Transformer）则专注动力学推演，支持末端位姿与夹爪状态输入，实现“指令即因果”的精准控制。实测在WorldArena等六大权威榜单中，于物理合规性、动作可控性、零样本泛化三大核心指标全部登顶SOTA——尤其在零样本基准EZSbench上刷新纪录。
https://www.qbitai.com/2026/04/404086.html

1-2. 3B激活参数！商汤Sage登顶PinchBench，端侧第一

商汤绝影推出端侧智能体基座模型“Sage”，仅以3B激活参数，在国际权威Agent评测PinchBench中达成94%任务完成率，超越Claude-Opus-4.6（93.3%）、GPT-5.4（90.5%）、Gemini-3（87.0%）等云端大模型。其算力消耗仅为竞品小米MiMo-v2-Pro的1/14，显存占用仅1/31，却反超6.6个百分点——有力打破“只有大模型才能做好Agent”的认知误区。

Sage真正实现了车载场景下的复杂任务闭环：一句“预热车内、导航回家、切换轻松音乐”，即可联动空调、导航、音响系统，首字响应快；还能主动感知儿童就座、拥堵路况并智能干预。背后两大自研技术功不可没：SCOUT（省60%训练算力）加速学习真实用车技能；ERL让多步推理出错可实时修正，复杂任务完成率提升20%。
https://www.163.com/dy/article/KR4DGMLI0511ABV6.html

1-3. 无需多视角，单图重建可交互3D模型！南洋理工开源结构推理框架

南洋理工大学团队推出的MonoArt，为3D生成领域带来重要突破：它能让单张照片“长出关节”，生成真正可动、可交互的3D模型（如能开门的冰箱、可折叠的椅子）。传统方法要么依赖多角度视频、庞大模型库，要么需外部先验而MonoArt仅凭一张图，通过四步渐进推理实现端到端可动物体重建。

四步分别是：①用TRELLIS骨干网恢复稳定3D几何；②识别部件并聚类点云特征；③解耦语义（“是什么”）与空间（“转在哪里”）进行运动推理；④输出物理可用参数——关节类型、旋转轴、中心位置、运动范围及部件层级关系。在PartNet-Mobility基准上，MonoArt在7类/46类任务中全面领先，推理仅需20.5秒，远快于Articulate-Anything（229.9秒）等方法。
https://www.163.com/dy/article/KR46M3P70511ABV6.html

项目链接：https://lihaitian.com/MonoArt/

1-4. 谷歌真急了！深夜更新Deep Research智能体，支持MCP、原生图表

谷歌正全力加速AI研究智能体的商业化落地。2月19日，其发布全新Gemini 3.1 Pro模型（ARC-AGI-2推理得分77.1%，是前代两倍），并同步推出两款企业级自主研究智能体：Deep Research（重速度）和Deep Research Max（重深度，支持扩展计算，HLE得分54.6%，DeepSearchQA达93.3%）。二者均通过Gemini API以付费预览版开放，暂不向普通用户或Gemini App订阅者开放，引发用户吐槽。

最大突破在于两大能力：一是支持Model Context Protocol（MCP），可安全接入私有数据库与FactSet、标普等专业金融数据源，实现内外信息融合；二是原生生成图表与信息图，告别纯文本报告。这意味着对冲基金或咨询公司能一夜跑完尽调，清晨收到带可视化结论的完整分析。
https://www.36kr.com/p/3777298681869061

1-5. 神秘模型「大象」：100B拿下SOTA，Token效率超高！

蚂蚁集团Inclusion AI团队推出的轻量级大模型「Elephant Alpha」正式浮出水面——它仅100B参数、支持256K上下文与32K输出，却在多项实测中表现亮眼：写代码“一次生成、精准修复”，3000字杂乱会议纪要3秒提炼为结构化JSON（含摘要、待办、邮件），CSV数据分析+自检全程仅12秒。

权威测评AI BENCHY显示：平均响应延迟约1秒（竞品10–30秒）、单次输出Token稳定在2500左右、指令遵循一致性高达9.6/10。它不拼参数堆料，专攻“快、准、省”——实测中Token消耗比Gemini-2.5-Flash-Lite低约40%，适合高频办公场景。当然，它暂不擅长超长链规划（如出海战略）或极新知识（如React 18最新API），需配合清晰Prompt或工具协同。
https://view.inews.qq.com/k/20260416A0527500

AI大模型算法、赛事和会议

2-1. 全球自动驾驶激战，滴滴与清华走出一条技术新路

滴滴自动驾驶与清华大学李升波教授团队深度合作，推出原创算法STAPO——它像“AI医生”，精准剔除大模型训练中仅约0.01%的错误信号，显著提升自动驾驶决策的稳定性与泛化能力。这项突破不是纸上谈兵，已直接用于端到端无人车模型微调。

背后是双方共建的“深穹远航实验室”，打通论文、代码、车辆、道路的全链路：清华提供顶尖理论与人才（论文引用超2.26万次），滴滴贡献十年积累的真实场景、2100天无事故运营数据及量产能力。目前，滴滴首款Robotaxi量产车R2已交付，关键零部件国产化率超90%，正于北京、广州开展全无人载客测试。滴滴依托日均千万单的主业现金流和混合派单等扎实运营能力，走出一条“稳扎稳打、慢即是快”的中国式路径。
https://www.163.com/dy/article/KR46M7MG0511ABV6.html

2-2. 国产多模态Agent拿下医学分割SOTA！不用改模型、不加token | 浙大&上海AI Lab

浙江大学蔡钰祥教授与上海人工智能实验室江彦开团队提出的IBISAgent，被CVPR 2026接收，是一项突破性生物医学图像分割新范式。它直击当前医学大模型的四大痛点：单次推理无力处理细微病灶、隐式分割标记（如<SEG>）损害语言能力、缺乏真实临床式的交互逻辑。

IBISAgent将分割重构为“看—想—点—调”的多步自主决策过程，全程无需新增模块或token，语言与视觉能力完全保留。研究创新性构建45.6万条高质量自动轨迹数据（基于340万图像-mask对+Gemini-2.5-Pro推理），并引入两阶段训练：冷启动监督微调（SFT）+细粒度强化学习（RL）。在三大权威测试集上，其平均IoU达80.61（较基线提升35.13%），交互步数从11.29大幅压缩至4.26步。
https://aitntnews.com/newDetail.html?newId=24311

论文链接：

AI人才和资本动态

3-1. 前小鹏汽车自动驾驶一号位李力耘出任众擎CTO，加速打造具身大脑

近日，前小鹏汽车自动驾驶“一号位”、副总裁李力耘正式加盟人形机器人公司众擎，出任首席技术官（CTO）。这位41岁的清华本硕、纽约大学博士，曾带领超千人团队推动小鹏智驾从规则驱动迈向AI大模型时代，并深度参与百度Apollo等前沿AI项目。中国具身智能融资火热，仅众擎本月就完成2亿美元融资

众擎正加速构建“具身大脑”技术体系：以多模态感知为输入，融合“本体（硬件）+小脑（运动控制）+大脑（决策推理）+神经末梢（实时响应）”的全集成架构。相比纯学术路线，李力耘带来的正是自动驾驶领域已验证的“工业化AI”打法——高效数据飞轮、强工程部署能力与规模化落地经验。业内认为，这将显著缩短人形机器人从实验室走向工厂、家庭的进程。
https://www.qbitai.com/2026/04/404124.html

3-2. 把人类驾驶员赶出机场，复旦大牛校友要港股IPO了

驭势科技——专注机场与厂区的“AI司机”，正冲刺港股IPO。这家公司不搞热闹的Robotaxi（无人出租车），而是深耕封闭场景：为全球机场提供L4级无人驾驶解决方案，包括行李牵引车、摆渡车、巡逻车等。它是全球唯一专注机场大型商业运营L4自动驾驶的供应商，已落地17个中国机场、3个海外机场（含香港、卡塔尔），机场场景市占率超90%。

2025年上半年营收9865万元，三年半累计营收约5.9亿元，但尚未盈利（累计亏损约7.85亿元）。核心靠自研U-Drive®操作系统（已迭代至5.0版），累计无人行驶里程达900万公里，服务249家客户，含35家世界/中国500强企业。团队源自英特尔中国研究院，CEO吴甘沙为复旦校友。
https://www.163.com/dy/article/KR1VAMQM0511DSSR.html

3-3. 马斯克祭出「霸王条款」！Cursor焊死SpaceX战车，600亿砸穿OpenAI

马斯克再放大招：SpaceX以“600亿美元收购”或“100亿美元合作”为条件，将AI编程明星公司Cursor深度绑定。这并非普通并购，而是IPO前的关键叙事——SpaceX正筹备史上最大IPO（估值1.75万亿美元，融资750亿美元），急需强化AI故事。

Cursor虽增长惊人（2026年4月估值超500亿美元，年收入20亿美元，日活破100万），却无自研基础模型；xAI则因11位联合创始人全部离职而陷入重建。双方一拍即合：xAI提供数万张芯片算力，助Cursor训练自研模型Composer；Cursor则补足SpaceX在AI产品端的短板。表面是“买或租”的霸王条款，实则是马斯克“算力+模型+产品+太空基建+资本故事”五盘大棋的闭环一环。
https://www.163.com/dy/article/KR46M5Q00511ABV6.html

3-4. 曝贝索斯融资100亿美元，押注物理AI

贝索斯新创AI公司Project Prometheus正引发全球关注：这家成立于2025年的“物理AI”企业，最新获100亿美元融资（约合人民币682亿元），估值飙升至380亿美元（约2592亿元），成为全球资金最雄厚的早期AI公司之一——累计融资达162亿美元（首轮62亿+本轮100亿）。它由贝索斯与顶尖科学家维克·巴贾杰联合创办，两人均出任CEO，团队已近百人，核心成员来自OpenAI。

与ChatGPT等大模型不同，Project Prometheus不主打语言生成，而是专注让AI“理解物理世界”：通过仿真与试错，赋能航空航天、汽车制造等硬科技领域。这一路线高度契合贝索斯长期布局的太空与工程愿景。摩根大通、贝莱德等顶级金融机构参投，印证资本市场对“物理AI”的强烈信心。
https://www.36kr.com/p/3776444365226752

3-5. 清华姚班到全球 3D AI 第一：胡渊鸣Meshy ARR 超 4000 万美元

清华姚班出身、MIT博士胡渊鸣创办太极图形，早期屡次转型受挫——用户不愿为专业3D工具付费，却直言：“一个5块钱卖模型，我买！”2022年，团队果断转向，6小时内上线首个AI生成3D模型产品Meshy。

虽初版粗糙（曾产出“四脸怪物”），却意外在恐怖游戏等容错率高的场景找到突破口。此后，Meshy聚焦“能进工作流”而非“最完美”，快速渗透独立游戏、环境素材、3D打印、教育等领域。截至2026年，其ARR达3亿元人民币，全球用户超1000万，美欧市占率超60%，月增速稳定在20%–30%，超半数增长来自自然流量。它证明：AI生成3D已不只是技术概念，而是正在落地的生产力革命。
https://view.inews.qq.com/k/20260421A06FT200

AI风险与政策管理

4-1. Anthropic开始抢科学家了？周薪2.7万驻场，专治Claude专家级错误

Anthropic正以“科学家驻场”方式攻克AI科研最大瓶颈——科学判断力。其新推出的STEM Fellow项目，高薪（每周3800美元）、全职（3个月）、驻场（旧金山等地），大规模招募物理、材料、气候、生物等领域的科学家，不要求会机器学习，但必须具备扎实的专业直觉和纠错能力。

例如，有材料学家发现Claude误判相稳定性，便设计专用评测流程；气候科学家则把大气模型接入Claude，构建可调用工具的科研环境。这并非让科学家“用AI做研究”，而是请他们当AI的“高级审校”。此举标志着Anthropic科研战略三步跃迁：从2024年聚焦安全的AI Safety Fellows，到2025年发放API支持科研的AI for Science，再到如今把科学家请进办公室共建模型能力。
https://www.163.com/dy/article/KR3NCJGV0511ABV6.html

写在最后

欢迎大家关注、分享、转发本公众号，也欢迎直接与小编联系对接合作～

小问卷：公众号打分点评

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。

26年4月23日，全球AI资讯约15条：马斯克要用600亿美元拿下Cursor、贝索斯融资100亿美元 押注物理AI等

26年4月23日，全球AI资讯约15条：马斯克要用600亿美元拿下Cursor、贝索斯融资100亿美元押注物理AI等