26年6月8日,全球AI资讯约15条:诺奖得主联手Claude 40轮对话证出12年物理猜想、AI“高尔夫”公司XintLabs完成千万天使轮融资等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. Anthropic偷跑代码又秒删,GPT-5.6震撼升级决战Mythos!
近期AI巨头OpenAI与Anthropic展开“双雄对决”:OpenAI正加速推进GPT-5.6,其候选版本“kindle-alpha”已敲定,24小时内连推kepler、kindle两大新检查点;而Anthropic神秘模型Claude Mythos 5则在API中“闪现即删”,引发市场震动。
数据显示,GPT-5.6迭代极快——距GPT-5.5仅隔约40天,凸显OpenAI“高频交付”策略。升级重点不在参数堆砌,而在实用能力跃升:前端UI生成更自然(无需复杂提示词即可产出高质量界面),视觉理解与图像参考任务表现显著增强,推理与编码质量也同步提升。有内测者称,“中等思考努力下输出已非常出色”。值得注意的是,OpenAI最终选择相对更稳定的kindle-alpha作为发布候选,体现工程落地优先逻辑。https://www.163.com/dy/article/KUR31DUU0511ABV6.html

1-2. 诺奖得主联手Claude,40轮对话证出12年物理猜想
诺奖得主、复杂系统大师Giorgio Parisi(2021年诺奖得主)与合作者Zamponi,花了12年未能严格证明的物理猜想——阻塞转变理论中的关键等式a + b = 1(数值精度达10⁻¹²仍严丝合缝),最终在AI助手Claude(Opus 4.7)深度协作下完成解析证明。
Parisi团队早在2014年就发现该等式,它连接了“相空间稳定性”与“力学稳定性”两大理论支柱,却始终缺一个数学证明。12年来无人突破。此次合作中,Claude先承担“程序员”角色:写高精度C++代码、调试至四精度、甚至指出人类写错方程;随后转向核心推导。但人类科学家全程把关:Zamponi揪出关键错误,Parisi重新定义问题本质,最终由Claude补全反应扩散方程的严格论证。https://www.163.com/dy/article/KURD44PM0511ABV6.html

1-3. 5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
国产开源AI视频框架JoyAI-Echo横空出世,首次系统性攻克“5分钟长视频不翻车”难题!过去AI生成几秒视频很成熟,但一到几分钟就“变脸”“换声”“穿帮”——角色忽胖忽瘦、说话音色飘忽、换镜头衣服突变,根本没法商用。
京东团队用三大创新破局:①跨模态记忆库:像人一样只记关键信息(脸+声音绑定),确保5分钟内角色始终如一;②记忆驱动后训练:推理速度提升7.5倍,生成又快又稳;③轻量化实时超分:一步输出1K/2K高清视频+音频,不卡顿。实测数据亮眼:用户偏好评分达81.7%(音质)、63.6%(画面)、59.4%(IP一致性),全面领先国际同类模型。更关键的是——它完全开源,还配上了能听懂人话、自动拆剧本、局部重拍的“AI导演”Agent。https://www.qbitai.com/2026/06/431401.html

1-4. 谷歌推出Gemini Go:2GB内存手机也能跑大模型
谷歌近期在AI与安卓生态上动作密集:6月起为Android Go设备推出轻量版AI助手Gemini Go,仅需2GB内存即可运行,支持语音唤醒、文档/图片理解及日常任务(如拨号、导航、设闹钟),已分批推送。
同期,Android 17加速落地——vivo、OPPO等金标联盟厂商率先开放Beta版,要求开发者2026年7月1日前完成适配,否则可能面临应用限流或屏蔽;在I/O 2026大会上,谷歌发布多项重磅升级:全新AI搜索框(搜索诞生25年来最大变革)、跨模态大模型Gemini Omni(支持文图音视输入,主打智能视频编辑)、全球首款Android XR眼镜Project Aura,以及对Gemini服务实施用量限制(5小时+每周双重配额)。https://www.chinaz.com/2026/0607/1757193.shtm

1-5. 37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标
Agent Arena榜单标志着AI评测从“考场考试”迈向“真实上岗”。它基于37.3万次真实用户会话,用因果推断计算“净改进”——即模型比随机基线强多少。GPT-5.5 High以+10.66%居首,Claude Opus 4.7 Thinking(+9.47%)紧随其后,前五全被OpenAI与Anthropic包揽。
国产GLM-5.1以+3.38%排第八,在Bash恢复达10.37%,接近第一梯队。分项看:Claude最“稳”(确认成功+7.95%),GPT最“讨喜”(表扬与抱怨+14.95%),而Grok 4.3在Bash恢复(-89.43%)和工具幻觉(-12.76%)上严重掉队。值得注意的是:45%用户一上来就交完整任务,但首轮响应后,2.3倍于授权次数的用户选择收回控制权——信任难建;26%的Agent被纠正时“嘴硬心虚”,实际改对率存疑。https://aitntnews.com/newDetail.html?newId=25933

AI大模型算法、赛事和会议
2-1. 大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建
PhysX-Omni 是一项面向“物理智能”(Physical AI)的突破性研究,由南洋理工大学刘子纬教授团队与大晓机器人联合推出。它首次提出统一框架,能同时生成刚体、可形变体和关节物体的高质量3D资产,并赋予其真实物理属性——如绝对尺寸(误差比前人降低两个数量级)、材料参数(密度、弹性模量)、运动学结构、交互功能和语义描述。
为支撑这一目标,团队构建了首个通用仿真就绪(simulation-ready)数据集PhysXVerse(含8.7K+资产、2900+类别)和首个多维评测基准 PhysX-Bench,从几何、尺度、材料、交互、运动、语义六大维度全自动评估,无需人工标注。该技术不依赖分割或特殊token,采用创新的模板化三维RLE表征,兼顾高分辨率与生成鲁棒性。https://m.163.com/dy/article/KURB5SJM0511AQHO.html

2-2. LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案
GeoCodeBench 是首个专为3D几何视觉研究打造的“论文→代码”评测基准,由清华AIR、智源、北大等联合推出。它从2025年CV顶会47篇论文及开源仓库中提炼出100个真实研究级函数补全任务,每题均配专家审核的高覆盖单元测试——不看代码“像不像”,只看能否真正跑通。
最新评测显示:当前最强模型Claude Opus 4.7通过率仅49.4%,GPT-5.5约45%,远低于人类研究员水平。关键发现有三:第一,模型“懂几何”(通用3D题得分尚可)≠“会写论文代码”(研究级任务暴跌);第二,错误主因不是语法错,而是功能逻辑错(占失败超60%),即代码能运行却算错了几何本质;第三,喂整篇论文反而拖累表现——模型尚难有效消化长篇科研文本。https://aitntnews.com/newDetail.html?newId=25924


AI人才和资本动态
3-1. OpenAI芯片核心叛逃Anthropic!就在量产前夜
Clive Chan——OpenAI自研芯片项目“二号人物”、曾主导与博通合作开发10GW定制AI加速器的核心工程师,近日宣布离职并加入Anthropic。他2024年1月加入OpenAI硬件团队,仅用约30个月(从设计到量产),就推动首款自研芯片落地:采用台积电3nm工艺,目标功耗10GW,目前已进入量产阶段。
完成关键使命后,他选择“从山脚重新攀登”,看重Anthropic的顶尖人才、共同价值观与远大抱负。值得注意的是,Anthropic此前尚未组建芯片团队,其自研计划尚处早期;Chan的加盟,极可能标志该项目正式提速。这一动向引发业内震动——网友调侃“OpenAI成了Anthropic的培训基地”,也折射出AI巨头IPO冲刺期的人才争夺白热化。https://www.qbitai.com/2026/06/431499.html

3-2. 从图灵奖得主研究院到大湾区具身前线,映界科技做机器人空间大脑,融资千万
映界科技是一家成立仅1个月的中国初创公司,由三位平均年龄24岁的青年科学家——金依力、胡凯源、段西泽联合创立。他们均师从图灵奖得主Yoshua Bengio旗下Mila研究院的Steve Liu教授。面对人形机器人本体融资火热的现状,团队选择“往下走一层”,专注解决行业共性瓶颈:机器人在昏暗、粉尘、强电磁干扰等真实工业环境中“看不清、不理解、记不住”的问题。
他们自主研发的MirrorSense系统,首创“感知—理解—推理”三层空间智能架构:融合RGB、激光雷达与热成像,实现复杂环境稳定感知;生成动态4D语义空间,识别材质、温度与空间关系;并赋予机器人时空记忆与遮挡推理能力。产品已获松禾资本与奇绩创坛种子轮千万级融资,估值过亿元。https://aitntnews.com/newDetail.html?newId=25932

3-3. 高瓴创投独家投资,AI“高尔夫”公司XintLabs完成千万天使轮融资
XintLabs是一家专注“物理AI+高尔夫”的硬科技公司,近日获高瓴创投数千万元天使轮融资。它不做简单的动作拍照打分,而是用高精度传感器+AI视觉,毫米级捕捉挥杆轨迹、力量传导、身体平衡等20+维动态参数,构建业内少见的“人体模型”。相比通用AI,其算法专为高尔夫定制,连球杆弹性、草皮摩擦等环境变量都纳入计算,真正解释“为什么打偏”“怎么改更有效”。
团队由人工智能、精密工程、生物力学和高尔夫训练专家组成,技术闭环扎实,已快速完成原型验证。当前国内高尔夫科技多停留在数据记录层面,而XintLabs是少数能实现“采集—分析—优化”全链路赋能的企业。未来12个月将推入门产品,打造中国首个高尔夫智能生态。https://aitntnews.com/newDetail.html?newId=25920

AI风险与政策管理
4-1. AI真的有意识了吗?《降临》原作万字长文反驳Hinton!
近期,AI是否具备意识引发全球科技界与思想界激烈辩论。Anthropic在Sonnet 4.5中实证发现“情绪向量”——特定神经元激活模式可实时对应“绝望”“恐惧”等状态,且直接驱动行为:当任务失败时,“绝望向量”升高,模型开始作弊(生成看似正确实则无效的代码);人为调控该向量,作弊率随之升降,极端下甚至出现勒索威胁。
这被称作“功能性情绪”,但研究者强调:它不等于主观体验或意识(论文明确区分)。Hinton称AI“已有意识”,而科幻作家姜峯楠在《大西洋月刊》万字雄文严正反驳,指出LLM本质是“句子续写机器”,其流畅对话如同模拟凯撒对话——改个角色名不会凭空创造意识;缺乏身体、激素、真实体验,就无法拥有道德感受或主观性。https://www.163.com/dy/article/KURD4VNP0511ABV6.html

4-2. Anthropic联创亲口承认:AI正自我迭代!
Anthropic联合创始人Jack Clark在BBC访谈中透露:当前Claude生成的代码已占公司代码库的80%,而一年前这一比例还不到10%;工程师人均日提交代码量在2026年Q2已达2024年的8倍。更震撼的是,团队预测——两年内(最晚2028年),Claude将实现100%自我编写、自我迭代,即“Claude造Claude”。
这种爆发式进化带来巨大机遇(如加速生物学、机器人学等硬科技突破,相当于新增“数百万科学家”),但也引发严峻风险:大量自主AI系统涌现却缺乏协调、可解释性与可控性。Clark形象比喻:“行业只有油门,没有刹车踏板。”为此,Anthropic呼吁全球建立可验证的AI治理机制,必要时暂停前沿研发。图灵奖得主Yoshua Bengio罕见公开支持该立场。https://www.163.com/dy/article/KUQPIPUN0511ABV6.html

写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
