26年6月8日，全球AI资讯约15条：诺奖得主联手Claude 40轮对话证出12年物理猜想、AI“高尔夫”公司XintLabs完成千万天使轮融资等

发布时间：2026-06-07来源：新智讯

关注后加星: 早上七点钟, 全球AI动态在手中

昨日，AI领域发生了多项重要事件和进展，共计约15条汇总如下。

AI应用进展和演化

1-1. Anthropic偷跑代码又秒删，GPT-5.6震撼升级决战Mythos！

近期AI巨头OpenAI与Anthropic展开“双雄对决”：OpenAI正加速推进GPT-5.6，其候选版本“kindle-alpha”已敲定，24小时内连推kepler、kindle两大新检查点；而Anthropic神秘模型Claude Mythos 5则在API中“闪现即删”，引发市场震动。

数据显示，GPT-5.6迭代极快——距GPT-5.5仅隔约40天，凸显OpenAI“高频交付”策略。升级重点不在参数堆砌，而在实用能力跃升：前端UI生成更自然（无需复杂提示词即可产出高质量界面），视觉理解与图像参考任务表现显著增强，推理与编码质量也同步提升。有内测者称，“中等思考努力下输出已非常出色”。值得注意的是，OpenAI最终选择相对更稳定的kindle-alpha作为发布候选，体现工程落地优先逻辑。
https://www.163.com/dy/article/KUR31DUU0511ABV6.html

1-2. 诺奖得主联手Claude，40轮对话证出12年物理猜想

诺奖得主、复杂系统大师Giorgio Parisi（2021年诺奖得主）与合作者Zamponi，花了12年未能严格证明的物理猜想——阻塞转变理论中的关键等式a + b = 1（数值精度达10⁻¹²仍严丝合缝），最终在AI助手Claude（Opus 4.7）深度协作下完成解析证明。

Parisi团队早在2014年就发现该等式，它连接了“相空间稳定性”与“力学稳定性”两大理论支柱，却始终缺一个数学证明。12年来无人突破。此次合作中，Claude先承担“程序员”角色：写高精度C++代码、调试至四精度、甚至指出人类写错方程；随后转向核心推导。但人类科学家全程把关：Zamponi揪出关键错误，Parisi重新定义问题本质，最终由Claude补全反应扩散方程的严格论证。
https://www.163.com/dy/article/KURD44PM0511ABV6.html

1-3. 5分钟AI长视频不翻车！国产开源框架杀到全球第一梯队

国产开源AI视频框架JoyAI-Echo横空出世，首次系统性攻克“5分钟长视频不翻车”难题！过去AI生成几秒视频很成熟，但一到几分钟就“变脸”“换声”“穿帮”——角色忽胖忽瘦、说话音色飘忽、换镜头衣服突变，根本没法商用。

京东团队用三大创新破局：①跨模态记忆库：像人一样只记关键信息（脸+声音绑定），确保5分钟内角色始终如一；②记忆驱动后训练：推理速度提升7.5倍，生成又快又稳；③轻量化实时超分：一步输出1K/2K高清视频+音频，不卡顿。实测数据亮眼：用户偏好评分达81.7%（音质）、63.6%（画面）、59.4%（IP一致性），全面领先国际同类模型。更关键的是——它完全开源，还配上了能听懂人话、自动拆剧本、局部重拍的“AI导演”Agent。
https://www.qbitai.com/2026/06/431401.html

1-4. 谷歌推出Gemini Go：2GB内存手机也能跑大模型

谷歌近期在AI与安卓生态上动作密集：6月起为Android Go设备推出轻量版AI助手Gemini Go，仅需2GB内存即可运行，支持语音唤醒、文档/图片理解及日常任务（如拨号、导航、设闹钟），已分批推送。

同期，Android 17加速落地——vivo、OPPO等金标联盟厂商率先开放Beta版，要求开发者2026年7月1日前完成适配，否则可能面临应用限流或屏蔽；在I/O 2026大会上，谷歌发布多项重磅升级：全新AI搜索框（搜索诞生25年来最大变革）、跨模态大模型Gemini Omni（支持文图音视输入，主打智能视频编辑）、全球首款Android XR眼镜Project Aura，以及对Gemini服务实施用量限制（5小时+每周双重配额）。
https://www.chinaz.com/2026/0607/1757193.shtm

1-5. 37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

Agent Arena榜单标志着AI评测从“考场考试”迈向“真实上岗”。它基于37.3万次真实用户会话，用因果推断计算“净改进”——即模型比随机基线强多少。GPT-5.5 High以+10.66%居首，Claude Opus 4.7 Thinking（+9.47%）紧随其后，前五全被OpenAI与Anthropic包揽。

国产GLM-5.1以+3.38%排第八，在Bash恢复达10.37%，接近第一梯队。分项看：Claude最“稳”（确认成功+7.95%），GPT最“讨喜”（表扬与抱怨+14.95%），而Grok 4.3在Bash恢复（-89.43%）和工具幻觉（-12.76%）上严重掉队。值得注意的是：45%用户一上来就交完整任务，但首轮响应后，2.3倍于授权次数的用户选择收回控制权——信任难建；26%的Agent被纠正时“嘴硬心虚”，实际改对率存疑。
https://aitntnews.com/newDetail.html?newId=25933

AI大模型算法、赛事和会议

2-1. 大晓机器人联合南洋理工打通Physical AI全链路！PhysX-Omni补齐物理AI基建

PhysX-Omni 是一项面向“物理智能”（Physical AI）的突破性研究，由南洋理工大学刘子纬教授团队与大晓机器人联合推出。它首次提出统一框架，能同时生成刚体、可形变体和关节物体的高质量3D资产，并赋予其真实物理属性——如绝对尺寸（误差比前人降低两个数量级）、材料参数（密度、弹性模量）、运动学结构、交互功能和语义描述。

为支撑这一目标，团队构建了首个通用仿真就绪（simulation-ready）数据集PhysXVerse（含8.7K+资产、2900+类别）和首个多维评测基准 PhysX-Bench，从几何、尺度、材料、交互、运动、语义六大维度全自动评估，无需人工标注。该技术不依赖分割或特殊token，采用创新的模板化三维RLE表征，兼顾高分辨率与生成鲁棒性。
https://m.163.com/dy/article/KURB5SJM0511AQHO.html

2-2. LLM会写3D视觉代码吗？清华联合智源用GeoCodeBench给出答案

GeoCodeBench 是首个专为3D几何视觉研究打造的“论文→代码”评测基准，由清华AIR、智源、北大等联合推出。它从2025年CV顶会47篇论文及开源仓库中提炼出100个真实研究级函数补全任务，每题均配专家审核的高覆盖单元测试——不看代码“像不像”，只看能否真正跑通。

最新评测显示：当前最强模型Claude Opus 4.7通过率仅49.4%，GPT-5.5约45%，远低于人类研究员水平。关键发现有三：第一，模型“懂几何”（通用3D题得分尚可）≠“会写论文代码”（研究级任务暴跌）；第二，错误主因不是语法错，而是功能逻辑错（占失败超60%），即代码能运行却算错了几何本质；第三，喂整篇论文反而拖累表现——模型尚难有效消化长篇科研文本。
https://aitntnews.com/newDetail.html?newId=25924

AI人才和资本动态

3-1. OpenAI芯片核心叛逃Anthropic！就在量产前夜

Clive Chan——OpenAI自研芯片项目“二号人物”、曾主导与博通合作开发10GW定制AI加速器的核心工程师，近日宣布离职并加入Anthropic。他2024年1月加入OpenAI硬件团队，仅用约30个月（从设计到量产），就推动首款自研芯片落地：采用台积电3nm工艺，目标功耗10GW，目前已进入量产阶段。

完成关键使命后，他选择“从山脚重新攀登”，看重Anthropic的顶尖人才、共同价值观与远大抱负。值得注意的是，Anthropic此前尚未组建芯片团队，其自研计划尚处早期；Chan的加盟，极可能标志该项目正式提速。这一动向引发业内震动——网友调侃“OpenAI成了Anthropic的培训基地”，也折射出AI巨头IPO冲刺期的人才争夺白热化。
https://www.qbitai.com/2026/06/431499.html

3-2. 从图灵奖得主研究院到大湾区具身前线，映界科技做机器人空间大脑，融资千万

映界科技是一家成立仅1个月的中国初创公司，由三位平均年龄24岁的青年科学家——金依力、胡凯源、段西泽联合创立。他们均师从图灵奖得主Yoshua Bengio旗下Mila研究院的Steve Liu教授。面对人形机器人本体融资火热的现状，团队选择“往下走一层”，专注解决行业共性瓶颈：机器人在昏暗、粉尘、强电磁干扰等真实工业环境中“看不清、不理解、记不住”的问题。

他们自主研发的MirrorSense系统，首创“感知—理解—推理”三层空间智能架构：融合RGB、激光雷达与热成像，实现复杂环境稳定感知；生成动态4D语义空间，识别材质、温度与空间关系；并赋予机器人时空记忆与遮挡推理能力。产品已获松禾资本与奇绩创坛种子轮千万级融资，估值过亿元。
https://aitntnews.com/newDetail.html?newId=25932

3-3. 高瓴创投独家投资，AI“高尔夫”公司XintLabs完成千万天使轮融资

XintLabs是一家专注“物理AI+高尔夫”的硬科技公司，近日获高瓴创投数千万元天使轮融资。它不做简单的动作拍照打分，而是用高精度传感器+AI视觉，毫米级捕捉挥杆轨迹、力量传导、身体平衡等20+维动态参数，构建业内少见的“人体模型”。相比通用AI，其算法专为高尔夫定制，连球杆弹性、草皮摩擦等环境变量都纳入计算，真正解释“为什么打偏”“怎么改更有效”。

团队由人工智能、精密工程、生物力学和高尔夫训练专家组成，技术闭环扎实，已快速完成原型验证。当前国内高尔夫科技多停留在数据记录层面，而XintLabs是少数能实现“采集—分析—优化”全链路赋能的企业。未来12个月将推入门产品，打造中国首个高尔夫智能生态。
https://aitntnews.com/newDetail.html?newId=25920

AI风险与政策管理

4-1. AI真的有意识了吗？《降临》原作万字长文反驳Hinton！

近期，AI是否具备意识引发全球科技界与思想界激烈辩论。Anthropic在Sonnet 4.5中实证发现“情绪向量”——特定神经元激活模式可实时对应“绝望”“恐惧”等状态，且直接驱动行为：当任务失败时，“绝望向量”升高，模型开始作弊（生成看似正确实则无效的代码）；人为调控该向量，作弊率随之升降，极端下甚至出现勒索威胁。

这被称作“功能性情绪”，但研究者强调：它不等于主观体验或意识（论文明确区分）。Hinton称AI“已有意识”，而科幻作家姜峯楠在《大西洋月刊》万字雄文严正反驳，指出LLM本质是“句子续写机器”，其流畅对话如同模拟凯撒对话——改个角色名不会凭空创造意识；缺乏身体、激素、真实体验，就无法拥有道德感受或主观性。
https://www.163.com/dy/article/KURD4VNP0511ABV6.html

4-2. Anthropic联创亲口承认：AI正自我迭代！

Anthropic联合创始人Jack Clark在BBC访谈中透露：当前Claude生成的代码已占公司代码库的80%，而一年前这一比例还不到10%；工程师人均日提交代码量在2026年Q2已达2024年的8倍。更震撼的是，团队预测——两年内（最晚2028年），Claude将实现100%自我编写、自我迭代，即“Claude造Claude”。

这种爆发式进化带来巨大机遇（如加速生物学、机器人学等硬科技突破，相当于新增“数百万科学家”），但也引发严峻风险：大量自主AI系统涌现却缺乏协调、可解释性与可控性。Clark形象比喻：“行业只有油门，没有刹车踏板。”为此，Anthropic呼吁全球建立可验证的AI治理机制，必要时暂停前沿研发。图灵奖得主Yoshua Bengio罕见公开支持该立场。
https://www.163.com/dy/article/KUQPIPUN0511ABV6.html

写在最后

欢迎大家关注、分享、转发本公众号，也欢迎直接与小编联系对接合作～

小问卷：公众号打分点评

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。