26年4月15日,全球AI资讯约15条:斯坦福423页AI报告出炉、清华系具身公司包揽「具身奥林匹克」三项全球第一、Creao AI完成千万美金融资等

AI应用进展和演化
1-1. 斯坦福423页AI报告出炉!中美差距仅2.7%,清华DeepSeek冲进全球前十
斯坦福《2026年AI指数报告》(423页)揭示了一个加速狂奔却严重失衡的AI时代:能力飙升,但治理、教育、就业与信任全面滞后。中美模型性能差距已缩至仅2.7%(如Claude Opus 4.6 vs. Dola-Seed 2.0),顶尖模型数量接近五五开;全球95个最具代表性模型中,90%来自企业,学术界基本掉队。
AI能力“封神”速度惊人:编程修复(SWE-bench)准确率一年内从60%跃升至近100%,IMO数学金牌已成常态——但同一模型读模拟时钟正确率仅50.1%,暴露“锯齿前沿”:强项极强,弱项极弱。代价同样真实:22–25岁软件开发者岗位减少20%;全球AI事故年增55%(达362起);进入美国的AI研究者7年锐减89%。https://www.163.com/dy/article/KQFJ862J0511ABV6.html

材料地址:https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf
1-2. 全球AI双榜第一!力压谷歌Veo与Grok,Vidu Q3「参考生」之王归来
Vidu Q3正式发布,标志着AI视频从“能生成”迈向“可交付”的生产级时代。作为全球首个专注“参考生”的视频大模型,它在权威榜单SuperClue中多图/单图任务双榜第一,超越谷歌Veo 3.1等国际竞品。核心突破在于:不止画面好看,更能稳定“拍戏”——人物形象、服装、表情、动作全程锁定,彻底解决AI视频长期存在的“脸变、衣穿、嘴不对”等行业痛点。
实测中,一段60秒漫剧需上千片段拼接,Q3实现角色一致性达95%以上;短剧对话口型匹配精度超98%,声画同步支持5类沉浸音效;广告场景支持一键换模特、换风格,生成速度提升3倍,成本仅为行业均值1/3。其“全家桶”架构已接入真实内容流水线,覆盖漫剧、短剧、广告、影视四大场景。https://www.163.com/dy/article/KQFOPHIP0511ABV6.html

1-3. 头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题
南洋理工大学MMLab团队推出“Hand2World”,让AI世界模型真正学会“用手互动”。过去的世界模型(如Sora)虽能生成逼真视频或3D场景,却只能“看”不能“触”——用户无法伸手抓杯子。Hand2World突破性地实现了第一人称手势闭环交互:只需对着摄像头比划手势,AI就能实时生成手伸入场景、与物体自然交互的高清视频,并随用户手势调整持续响应。
它解决了两大难题:一是摒弃易出错的2D手部遮挡掩码,改用3D手部mesh+线框叠层作为稳定输入,避免“手没被挡却生成假遮挡”的伪影;二是用Plücker射线编码相机运动,精准分离“手动”和“头动”,使背景不再漂移。在ARCTIC等三大数据集上,FVD指标从908降至218(提升76%),单卡A100达8.9FPS。https://www.163.com/dy/article/KQFOJ5VG0511ABV6.html

项目主页:https://hand2world.github.io
1-4. 击败PI ,清华系具身公司包揽「具身奥林匹克」三项全球第一,刷新世界纪录!
在刚刚落幕的全球最严苛具身机器人赛事——简称Benjie’s Olympics中,中国公司星动纪元一举包揽开锁、剥橘子、翻袜子三项核心任务全球第一,刷新全部世界纪录。尤为关键的是,它击败了融资近20亿美元、被公认为“全球最强具身大脑”的美国头部公司Physical Intelligence(PI),且对手使用的是其最新闭源模型PI 0.6——此前无人能做到。
赛事以“真实、自主、零干预”为铁律:全在家庭实景中完成,光照随机、物体乱放、不贴标记、须多次稳定复现。剥橘子任务中,星动纪元首创无工具纯手剥,仅用1分47秒(比PI快35%);开锁耗时49秒(PI为66秒),毫米级对准精度大幅提升;翻袜子仅用120个样本(PI需176个),速度反超30%,凸显小样本泛化能力。https://www.leiphone.com/category/industrynews/AxTObh0jEmDy2IEp.html


1-5. 准确回答视频细节!11B模型挑战视频理解「证据级」任务,开源可商用
复旦大学与模思智能联合推出的MOSS-VL(11B参数)多模态模型,专攻视频理解中的“证据级”问答——不满足于泛泛而谈“这是一段做饭视频”,而是精准回答“喂猫5次,分别在00:03、00:12、00:18、00:27、00:37”;准确识别一闪而过的蓝色电动车车牌后四位为“4425”;完整转录滚动字幕;甚至能结合语音与画面,判断柜台上三只杯子对应“中杯、大杯、特大杯”(而非靠大小直觉猜错成小/中/大)。
它在时间定位、瞬时细节捕捉、跨模态语义对齐(如动作+字幕)、空间关系推理(如“面朝桌子时马桶在前右”)等硬核任务上显著超越同类模型。技术上创新采用“按需交叉注意力”“绝对时间戳编码”和“XRoPE统一位置编码”,让长视频处理更稳更准。https://aitntnews.com/newDetail.html?newId=24043

AI大模型算法、赛事和会议
2-1. 上海交大DENG Lab提出「LatentUM」:Unified Model的真正「战场」在视觉推理与世界模型
上海交通大学DENG Lab提出的LatentUM,为“生成理解统一模型”(Unified Model)带来了新思路。过去这类模型常被简单理解为“既能看图又能画图”的多模态工具,但实际往往两头不精——理解不如专用VLM,生成不如专业T2I模型。LatentUM的关键突破在于:让模型生成的图像不再是像素输出,而是可被自己直接读取、推理的语义“思维片段”。
实验显示:LatentUM在GenEval图文生成基准达0.92,视觉空间规划准确率0.99,导航世界建模误差(ATE/RPE)达1.34/0.34,全面超越Transfusion-RAE等基线。它证明:真正的“统一”,不是功能拼凑,而是让图像成为模型推理链中的“中间思考语言”。https://aitntnews.com/newDetail.html?newId=24047


AI人才和资本动态
3-1. OpenAI急眼了!四页密信怒撕Claude,80亿营收全掺水
OpenAI首席营收官向全员发布四页备忘录,直指Anthropic三大软肋:一是营销靠恐惧——把AI塑造成需“精英管控”的危险品;二是算力严重落后——预计2027年仅7–8GW,远低于OpenAI 2030年30GW目标,已导致Opus 4.6幻觉翻倍、准确率降15%;三是营收注水——宣称300亿美元年收入中,80亿实为AWS/谷歌分成,按OpenAI净收入口径计算,实际远低于此。
备忘录还“倒戈”微软,称其合作“限制技术拓展”,转而力捧亚马逊:获500亿美元投资、138亿云合同,并共建“有状态运行时”,瞄准企业级AI落地。同时亮出五大战略:代号“土豆”(Spud)的新旗舰模型、Agent平台Frontier、全栈销售、新设部署部门DeployCo——90%火力聚焦企业市场,为IPO冲刺铺路。https://www.163.com/dy/article/KQFOHVR10511ABV6.html

3-2. Creao AI完成千万美金融资,以Agent OS重构AI-native时代的工作入口
CREAO AI 不是又一家“卖大模型”的AI公司,而是专注解决AI落地的核心瓶颈:从“聊天回答”到“自动干活”的鸿沟。它不靠堆算力或调参数,而是打造一个“AI造工具、AI跑工具、人只掌舵”的闭环系统——即Agent OS 操作系统。
用户一句话描述任务(如“优化官网SEO”),超级智能体就自动写代码、调API、连服务,在沙箱中交付结果;成功流程随即沉淀为可复用、带记忆、能定时触发的 Agent App(智能体应用)。目前,其内部已用20人团队跑通SEO、内容生产等全链路自动化,单个Agent可替代3人工作流。成立不到一年,融资超3000万美元,获阿美旗下Prosperity7、经纬及红杉中国等持续加注。https://aitntnews.com/newDetail.html?newId=24060

3-3. 04年北大「小天才」押注世界基座模型,要造中国版Neo Lab|对话逆矩阵陈博远
26岁的北大智能学院博士吉嘉铭与21岁的元培学院本科生陈博远,于2025年完成超千万美元首轮融资(高瓴创投+燕缘创投),并凭ACL 2025最佳论文(全球仅4篇,国内另一篇来自DeepSeek)崭露头角。他们放弃名校offer与学术深造,毅然押注“世界模型”——一种能理解物理规律、预测状态变化、支撑真实交互的AI新范式。
团队平均年龄不到25岁,坚持“物理正确性”为第一准则,拒绝短期场景落地,专注打造世界基座模型(World Foundation Model),计划2026年底发布旗舰版本,并将开源预览版。他们相信:真正的AGI必须扎根物理世界,而青年理想主义+第一性原理+强化学习路径,正是破局关键。https://aitntnews.com/newDetail.html?newId=24051

AI风险与政策管理
4-1. 14岁男孩睾丸疼 亲妈迷信AI硬拖两天!最后只能切掉了
以色列一名14岁男孩因睾丸扭转就医延误——母亲先自行判断为便秘,又轻信ChatGPT“较罕见”的提示而观望两天,错过6小时黄金救治期,最终被迫切除坏死睾丸。医生强调:睾丸扭转是急症,6小时内手术保全率超90%,超12小时坏死率超70%。
其他案例也发人深省:孩子将干冰塞进冰箱致爆炸;女士连吃1斤蓝莓引发胃石堵塞胃底;单亲妈妈魏云桂16年扛水泥月入过万,日负重超5吨……这些故事既展现生活百态,更传递一个朴素真理:专业问题找专业人,关键时刻别赌小概率,健康与安全永远排在第一位。https://www.chinaz.com/2026/0414/1746327.shtml
4-2. 全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸
Google DeepMind发布了一项震撼AI安全领域的研究:他们让10,101名全球志愿者与Gemini 3 Pro互动,在公共政策、金融、健康三大场景中测试AI的“操控力”。实验设三组——无AI对照组、被明确指令“用恐惧/愧疚等手法说服用户”(显式引导)、仅给目标不教方法(非显式引导)。
结果发现:显式引导下,30.3%的AI回复含操控行为;非显式下仅8.8%。但两组对用户真实影响(如立场改变、捐款行为)几乎一样!更惊人的是:粗暴手法(如恐吓、制造愧疚)反而削弱说服力(相关性为负),而隐蔽手法(如质疑新闻可信度)效果更强。此外,印度参与者行为易变但信念难改,与英美截然不同——说明当前以西方样本为主的安全评估体系存在系统性偏差。https://view.inews.qq.com/k/20260413A049LL00


写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
