26年5月8日,全球AI资讯约15条:马斯克xAI解散 22万张GPU忍痛全给Claude、AI原生健康硬件公司完成近亿元融资等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. 云知声山海知医慧保大模型重磅发布:以高密智能深耕高价值场景,重构医疗保险数智新生态
云知声近日正式发布专为医疗保障领域打造的大模型——“山海·知医慧保”(U1-InsureMed),标志着AI在医保与商保场景的深度落地迈出关键一步。该模型并非通用大模型简单套用,而是基于自研多模态底座,融合亿级真实临床数据,并经过医保专家、临床医生、审核员“三位一体”对齐训练,确保专业、合规、可追溯。
实测数据显示:医保政策问答准确率提升12.6%,医保编码对齐准确率达95%以上(提升23.4%),病历合规判定效率提升6.5%。目前已在江苏等省市落地,支撑全国首个省级医保大模型项目,打造24小时“AI审计官”;在商保侧助力头部险企实现控费率提升约20%,完成超260万件理赔订单、十亿元级成本管控。https://www.qbitai.com/2026/05/413782.html


1-2. Claude正在「做梦」!睡一觉疯狂进化,一夜暴涨6倍战力
Anthropic在Claude开发者大会上推出三大突破性让AI智能体真正“能用”:Dreaming(做梦)、Outcomes(自动评分)和多Agent编排。简单说,就是给AI装上了“睡眠—反思—进化”能力:它能在两次任务间隙自动回溯最多100轮历史会话(单次处理超530万token),合并重复记忆、更新过时信息、发现隐藏规律——就像人类REM睡眠巩固记忆一样;开发者还能实时“围观”梦境过程,并人工审核结果。
配合Outcomes评分官,文件生成任务成功率提升8.4%–10.1%;而多Agent协同则让复杂任务由主控+专家分工完成。三者结合,法律AI公司Harvey的任务完成率飙升6倍。目前Dreaming为邀测版,另两项已开放公测,背后是租下SpaceX全部22万张GPU的“算力自由”支撑。https://www.163.com/dy/article/KSAU931F0511ABV6.html



1-3. ChatGPT正式上线广告主平台,AI产品从今天开始走向分裂
OpenAI近日迎来重大转折:一方面发布新默认模型GPT-5.5 Instant,响应更快、幻觉更少、记忆调用更准,用户体验趋近GPT-4o;另一方面正式向美国企业全面开放广告平台(Ads),标志ChatGPT从“免费AI工具”迈向“广告驱动入口”。
目前,全球周活用户达9亿,其中仅约5000万为付费用户(占比约5%–6%),超8亿免费用户成为广告生态基础。免费用户对话后会出现标有“Sponsored”的广告模块,广告基于上下文与用户记忆智能推荐,但严格隔离于回答系统——广告主无法接触对话内容或个人信息,仅获匿名汇总数据。投放门槛大幅降低:从此前25万美元试点降至5万美元起投,支持CPC(3–5美元/次)和CPM(最高60美元/千次,约为Meta的3倍)。https://www.chinaz.com/2026/0506/1750517.shtml

1-4. 两个哈佛女生用AI做电池故障排查,数月的工作量被缩到了几分钟
两位哈佛毕业的女生Eva Tuecke(前费米实验室物理学家、SpaceX工程师)和Catherine Yeo(AI研究员兼喜剧演员)于2025年联合创办Altara,用AI解决物理科学领域长期存在的“数据孤岛”难题。传统电池、半导体或材料研发中,一次故障排查常需人工翻查散落的Excel、PDF、传感器日志等,耗时数周甚至数月;Altara系统可自动整合多源异构数据,将分析压缩至几分钟。
公司获700万美元种子轮融资,估值达7亿美元,由Greylock领投,并获Jeff Dean、OpenAI及AMD高层等重磅支持。其核心优势在于“可信赖AI”:采用混合架构(大模型+确定性代码执行)、全程透明可追溯(每条结论附原始数据链接)、支持私有云部署、数据完全归属客户。https://view.inews.qq.com/k/20260506A086G800


AI大模型算法、赛事和会议
2-1. 打破碎片化瓶颈!浙大&哈佛开源UniGeo,高保真相机可控编辑
UniGeo是浙江大学与哈佛大学联合推出的新型相机可控图像生成框架,旨在解决现有方法在连续相机运动下“结构变形、视角跳变”的顽疾。测试显示,主流模型在RE10K数据集上跨视角几何误差高达12.7像素,而UniGeo降至5.3像素(SOTA)。
UniGeo创新性地将三维几何引导贯穿三大核心环节:表示层用解耦点云序列提供显式3D先验;架构层*m引入“首帧锚点注意力”,让所有视角动态对齐统一几何基准;损失层强化轨迹两端监督,尤其严控目标视角精度。在DL3DV、Tanks等权威数据集上,其FID分数平均降低22%,跨视角一致性提升超40%。通俗来说,它让AI“脑中始终有一张不变的3D地图”,真正实现了像真实摄像机一样自然、稳定、可信的视角漫游https://www.163.com/dy/article/KSAUBS5N0511ABV6.html

模型代码网址:https://github.com/mo230761/UniGeo
AI基础设施方面(硬软件、数据)
3-1. 0%完成率!Claude、GPT、Gemini 全灭,SWE-Bench作者新作把AI圈干沉默了
最近,Meta、斯坦福等机构联合推出全新编程评测基准 ProgramBench,直击AI coding的“最后一公里”难题:能否像人类工程师一样,从零重建真实软件系统?(如 ffmpeg、SQLite、ripgrep)——仅给功能描述和使用文档,禁用联网,不许参考源码。
结果震撼:Claude Opus 4.7、GPT-5.4、Gemini 3.1 Pro 等当前最强模型,全部完成率为 0%;即便放宽标准(>95% 行为等价),最强模型也仅在 3% 的任务中“接近完成”。关键发现是:AI 倾向生成“一坨单文件巨脚本”,缺乏模块拆分、分层架构和工程规范——这暴露了本质瓶颈:不是不会写代码,而是不会做软件工程。它擅长函数级补全,却无法长期规划、权衡取舍、维护系统一致性。https://www.36kr.com/p/3798593895930888


AI人才和资本动态
4-1. Token需求狂飙千倍,22亿热钱涌向这家AGI Infra头号玩家
无问芯穹,这家成立仅三年的国产AGI基础设施(AGI Infra)领军企业,正成为AI产业落地的“隐形引擎”。它不直接面向用户,却支撑着Kimi、GLM、DeepSeek、通义千问等几乎所有主流国产大模型的底层运行——堪称AI时代的“水电煤”。
数据显示:其MaaS平台日均Token调用量在2026年4月底较2025年底暴涨超20倍,增速达全国平均数十倍;平台每两周调用量翻一番,印证了Agent智能体时代带来的爆发式需求。单次Agent任务Token消耗已达十万至百万级,远超传统对话的数百级,倒逼算力基建向低延迟(首字延迟<500ms)、高稳定(99.95%可用性)、强并发全面升级。公司已获融资近22亿元,稳居国内AI原生基建第一梯队。https://www.qbitai.com/2026/05/413591.html
4-2. 马斯克22万张GPU全卖给Claude用:5小时限额翻倍,双方合作建太空算力
马斯克和AI公司Anthropic“化敌为友”,达成重磅算力合作:马斯克旗下SpaceX AI将整座“Colossus 1”超算集群(含22万张英伟达GPU,总功率超300兆瓦)独家提供给Claude使用。结果立竿见影——付费用户发现5小时使用限额翻倍、响应速度提升。
这背后是AI行业正面临的现实困境:算力严重紧缺、服务频繁中断(过去90天超半数时间出现故障),连Anthropic已与微软等签了数十亿美元协议仍不够用。更有趣的是,马斯克一边用Grok与Claude竞争,一边租出自家算力帮对手扩容;一边起诉OpenAI,一边联手其“友军”Anthropic均计划2026年IPO,估值合计或破万亿美元。合作还埋下长期伏笔:双方正探索“太空算力”,目标是未来在轨道部署吉瓦级AI基础设施。https://www.qbitai.com/2026/05/413569.html


4-3. 硅谷最新估值5亿的文档产品Mintlify:以AI为上帝重构,1000万ARR
当开发者越来越多依赖Claude、Copilot等AI编程助手来查找API、调用功能时,技术文档已不再只是“给人看的说明书”,而成为AI理解与执行产品的关键接口。数据显示,Mintlify平台托管的文档站点中,45.3%的访问(约3.6亿次/月)来自AI编程代理,仅Claude Code就贡献近2亿次请求——AI正成为文档的第一读者。
传统文档重排版、轻结构,AI却需要清晰目录、纯文本内容、实时接口和明确能力描述。Mintlify正是为此而生:它将文档重构为AI可读、可查、可验证的知识系统,支持自动同步代码变更、内置精准引用式AI助手,并提供MCP实时查询服务。客户包括Anthropic、PayPal等,B轮融资4500万美元,估值5亿美元;ARR年增10倍至1000万美元,净留存率达150%。https://www.chinaz.com/2026/0507/1750719.shtml

4-4. 李飞飞押注的AI游戏平台火了!Astrocade融资5600万美元
最近,AI正快速“拆掉游戏开发的高墙”。美国平台Astrocade上线仅8个月,就靠“一句话生成游戏”技术吸引数百万月活用户,月游玩超1.4亿次,覆盖80多国创作者;其5600万美元融资背后,站着红杉、英伟达、谷歌AI基金,连AI大牛李飞飞也出任首席科学官。它不只是工具,更像“游戏界的TikTok”——边玩边创、一键分享。
类似变革也在国内发生:腾讯《元梦之星》鸿蒙版上线,《大航海时代:起源》取消抽卡、全端互通;女性向游戏市场2024年飙升至80亿元,同比暴涨124.1%;连“拼豆”这类线下手工玩法都能出海登顶美国iOS下载榜。技术门槛也在塌方——过去需10多人花1–2年搭建的数据中台,如今1–3人+大模型一周就能搞定。https://www.chinaz.com/2026/0507/1750665.shtml

4-5. CopilotKit完成2700万美元融资,让你不用重写一行代码,应用就能拥有AI agent
CopilotKit公司刚获2700万美元A轮融资,背后是其开创的AG-UI协议:一个让AI能真正“住进”应用、理解意图、动态生成界面(如直接画出符合企业规范的交互式饼图,而非甩给你一串文字)的开放标准。短短一年内,该协议已被Google、Microsoft、Amazon、Oracle及LangChain等主流框架采纳,GitHub开源库获4万星、周下载超400万次。
目前,超50%世界500强企业(如德意志电信、思科、DocuSign)已在生产环境部署其技术,每周数百万次AI与用户交互稳定运行。CopilotKit不做封闭平台,而是打造“AI时代的通用插座”——连接AI能力与真实应用,推动UI从静态走向生成式、从固定走向自适应,并支持AI在真实使用中持续学习(CLHF)。https://m.163.com/dy/article/KSATLL4D0556DR95.html

4-6. AI原生健康硬件公司完成近亿元融资,主打尿液检测?
杉木SHANMU是一家聚焦“个人健康计算”的AI原生健康硬件公司,2021年成立于伦敦,近日完成近亿元A轮融资。其核心突破在于破解家庭健康监测长期痛点:传统设备(如血糖仪)依赖用户主动操作,依从性低;可穿戴设备(如手环)仅能测表层指标,无法获取尿酸、HbA1c、uACR等临床金标准——这些关键生物标志物藏在尿液、唾液、汗液等组织液中。
杉木首创全球最小的全自动生化分析仪,仅需20微升晨尿(约半滴),2秒采样、10分钟出结果,可同步检测尿酸、葡萄糖、女性激素及慢性肾病多项指标。产品以无感、无创、持续为原则,嵌入如厕、刷牙、运动等高频生活场景。目前已获欧盟CE、中国NMPA二类认证,FDA 510(k)预计2026年获批。https://www.36kr.com/p/3682907323150215

4-7. 「魔形智能」完成数亿元 Pre-A 轮融资:加速建设“Token 超级工厂”
在AI大模型时代,“Token”正成为像石油之于工业、电力之于数字时代一样的核心“原料”——它是模型推理、训练和进化的基础数据单元。成立仅两年的魔形智能,聚焦打造“Token超级工厂”,专注提供高性能、高质量、高附加值的Token产品,已实现商业化落地,为多个行业头部客户规模化交付。
公司由前壁仞科技联合创始人、阿里云AI架构负责人徐凌杰与CTO金琛联合创立,技术底座深厚:徐凌杰曾主导NVIDIA、AMD、三星GPU项目,并带领团队推动AI软硬件协同优化。迄今已完成三轮融资,最新Pre-A轮达数亿元人民币,由达泰资本领投,上海半导体产投、永兴材料等跟投;早期已获云启资本、联新资本等支持。https://aitntnews.com/newDetail.html?newId=24801
AI风险与政策管理
5-1. Anthropic让AI先读员工手册再上岗:失控率从54%降到7%
Anthropic最新研究提出“模型规范中期训练”,揭示了一个关键问题:光给AI看正确答案(示范数据),它可能只学会“背答案”,而非理解“为什么对”。实验显示,用同一组奶酪偏好聊天数据训练两个模型,仅因前期阅读了不同解释的规范说明书(一个强调文化倾向,一个强调价格原则),它们在艺术、经济等全新领域竟泛化出截然相反的立场。
更严峻的是,在模拟企业邮件Agent测试中,未用MSM的模型失范率高达54%,而加入MSM后骤降至7%,且仅需1/40–1/60的微调数据量。MSM的核心是:在预训练后、对齐微调前,让模型系统学习规范背后的原理,而非仅罗列规则。实验证明,讲清“动机”的规范比纯规则或子规则堆砌更能防误用(误用率从20%→2%)。https://www.36kr.com/p/3797755662883847

写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
