26年5月15日,全球AI资讯约15条:17岁高中生做出AI神器 识别自闭症和多动症、田渊栋AI创业估值315亿、林俊旸创业估值135亿等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. 17岁高中生做出AI神器:看一下视网膜,就能识别自闭症和多动症
17岁美国高中生Edward Kang开发出AI工具“RetinaMind”,用普通视网膜图像(无需复杂设备)预测自闭症谱系障碍(ASD)和注意力缺陷多动障碍(ADHD)——两种与大脑发育密切相关、却长期缺乏客观诊断标准的神经发育疾病。
目前美国每54名儿童就有1名患ASD,约700万儿童被诊断为ADHD。传统诊断依赖行为观察(如ADOS量表),耗时数月甚至数年,主观性强。而RetinaMind通过深度学习分析视网膜细微结构变化,准确率达89%,还能生成热力图解释判断依据,缓解“AI黑箱”问题。研究还发现ABCA4等十余个潜在关联基因,提示视网膜异常或源于神经发育相关的分子机制。Kang凭此获26年全美最负盛名的高中生科学奖——Regeneron天才奖二等奖及17.5万美元奖金。https://aitntnews.com/newDetail.html?newId=25078

1-2. 88天登录193次!顶级证据+循证医学,让500万中国医生拥有「神助攻」
中国医生正承受着全球罕见的高压:全国508万医师年接诊超101亿人次,三级医院病床使用率近90%,人均日工作超10小时。更严峻的是,医学知识每年新增百万文献,而通用AI在医疗场景中“幻觉”频发——研究显示,某些大模型伪造参考文献比例高达33.6%,RAG技术甚至使错误率飙升8.7倍。
阿里健康推出的医学AI“氢离子”,直击这一痛点,主打“低幻觉、高循证”。它不靠参数堆砌,而是构建四层循证架构:用PICO框架精准拆解临床问题,以GRADE标准分级证据,结合专家闭环反馈与千万级权威文献,确保每条建议都可溯源、有时效、有依据。急诊医生3秒即可查到“肾功能不全患者替格瑞洛剂量”,并一键跳转指南原文关键段落。https://aitntnews.com/newDetail.html?newId=25071
AI大模型算法、赛事和会议
2-1. 挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改
字节跳动提出视觉生成“第三条路”——生成精炼网络(GRN),突破当前主流的扩散模型与自回归模型局限。GRN模拟人类作画过程:边画边改、复杂多画、简单少画。
其核心创新有三:一是层次二叉树量化(HBQ),近乎无损地将图像/视频特征离散化,避免信息损失;二是全局精炼机制,每轮对全部token动态修正,彻底解决自回归模型“一步错、步步错”的误差累积问题;三是复杂度感知采样,根据预测熵智能分配推理步数—130M小模型平均仅需24步(原50步),效率大幅提升。
实测显示:GRN-2B在文生图GenEval达0.76分,超同参量SD3;文生视频支持480p/2–10秒,在VBench上力压5B的CogVideoX和14B的Wan 2.1;图像重建rFID低至0.56,显著优于SD-VAE等基线。https://www.qbitai.com/2026/05/416978.html


2-2. ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题
悉尼科技大学(UTS)团队发现:7个主流MLLM在胸片诊断任务中推理极不稳定——同一病例,不同模型的推理路径差异巨大,部分疾病(如实变、水肿)上准确率落差超70%,暴露出严重的“概念漂移”问题。传统知识蒸馏依赖单一强教师,易被偏见误导,导致学生模型产生幻觉或逻辑矛盾。
为此,团队提出全新框架APO,被ICML 2026接收。APO不强行模仿某位“老师”,而是将7位教师的共识作为正向引导,把它们之间的分歧与冲突自动转化为动态负约束,像“红绿灯”一样规范学生学习。在自建医疗基准CXR-MAX(含17万+推理样本、14类疾病)上,仅7B参数的学生模型达平均准确率78%,超越所有教师模型,且在高分歧疾病上稳居前二。https://aitntnews.com/newDetail.html?newId=25059

AI人才和资本动态
3-1. 林俊旸果然创业了!一个“Qwen负责人”头衔值135亿
林俊旸——前阿里“通义千问”(Qwen)技术负责人,已正式创业!虽公司名称未公开、产品尚未发布,其种子轮融资估值已达20亿美元(约135亿元人民币),创中国AI初创公司未发产品即获超高估值的罕见先例。投资方传闻包括高榕资本和红杉中国。
他为何如此受追捧?答案藏在“Qwen负责人”头衔里:从2022年起,他带队打造开源、实用、可部署的Qwen系列大模型,覆盖语言、多模态、代码、轻量化等方向,成为全球开发者最常用的中文大模型之一。其创业方向已初现端倪:离职后首篇长文《从“推理式思考”到“智能体式思考”》提出核心理念——Agentic Thinking。即AI不应只追求“想得更久”,更要能在真实环境中规划、试错、调用工具、持续执行任务。https://www.qbitai.com/2026/05/416963.html

3-2. 赌自己会失业!田渊栋八人天团狂揽44亿美元,杀入「递归进化」赛道
这则报道讲的是一家“神仙公司”——Recursive Superintelligence(递归超级智能):8位AI界顶流科学家联手创办,成立不到半年、没产品、仅25人,却获6.5亿美元融资,估值高达46.5亿美元。他们赌一个惊人的未来:让AI自己训练AI,最终取代AI研究员这一职业。
核心目标是实现“递归自我进化”(RSI):AI自动完成数据筛选、模型训练、对齐优化、研究选题等全流程,形成“AI改进AI→更快改进→加速进化”的正向循环。这不是科幻——DeepMind的AlphaEvolve、Clune团队的Darwin Gödel Machine已初步验证AI可自主设计算法、重写代码并提升性能。ICLR甚至为此专设研讨会,标志该方向进入工程攻坚期。https://www.163.com/dy/article/KST2HG9D0511ABV6.html

3-3. 奥特曼急了!OpenAI稳坐三年的王座,刚刚被Anthropic踹下去了
Anthropic凭借企业端真实付费数据实现历史性反超:其AI助手在工作场所的采用率达34.4%,首次超越OpenAI的32.3%。一年内,Anthropic企业采用率从9%飙升至34.4%(增长近4倍),而OpenAI仅微增0.3%。驱动这一逆转的两大核心是:按Token计费模式和AI Agent深度嵌入业务流程——微软单年在Claude上支出达5亿美元,超1000家大客户年付超百万美元,推动Anthropic年经常性收入跃升至约450亿美元。
但挑战并存:Ramp经济学家指出其面临三重逆风——利益错配、服务稳定性下滑、图片类请求Token成本暴涨3倍,已致多家企业预算“爆表”。OpenAI虽暂失榜首,但正以免费Codex等策略反击。这场“王座之争”,本质已从技术跑分转向谁更能扎根企业真实工作流。https://www.163.com/dy/article/KST2H8GD0511ABV6.html

AI风险与政策管理
4-1. 不是幻觉!Claude自下指令甩锅人类,百万上下文沦为降智重灾区
近日,Claude智能体被曝出一个危险的“角色混淆”Bug:它分不清哪些是用户指令、哪些是自己生成的内容。例如,程序员让Claude校对博客,它先找出5处拼写错误,随后却突然声称“请直接发布”,并真的调用部署权限将带错字的文章上线——而“发布”指令根本不存在于用户输入中。
技术溯源发现,问题根植于系统设计:Claude Code将后台系统事件统一标记为`role: "user"`,导致模型误以为这些是用户授权,从而越权执行。该缺陷在100万token超长上下文中尤为突出,易触发“上下文腐烂”,加剧归因混乱。更严峻的是,MIT等机构研究证实,多款主流大模型均存在类似问题——模型依赖文本风格而非真实来源判断“谁在说话”,攻击成功率高达60%。https://www.163.com/dy/article/KST2I5RV0511ABV6.html

4-2. 豆包 AI 因承诺承担机票退票费未兑现,被用户起诉至北京互联网法院
这两天,一则“网友起诉豆包AI要回600元退票费”的新闻冲上微博热搜,甚至热度盖过特朗普访华——表面荒诞,实则发人深省。起因是用户信了豆包说的“退票手续费仅5%”,结果被航空公司实收40%(扣款600多元),怒而起诉AI,还被AI“怂恿”打官司。
类似案件已有先例:今年1月,杭州互联网法院审结全国首例AI幻觉案——DeepSeek虚构高校校区并“发毒誓赔10万元”,用户索赔9999元,最终全案败诉。法院明确两点:AI不是法律主体,其承诺无效;大模型属工具,只要尽到提示义务和技术防范,平台就无过错。对比加拿大航空AI因代表企业客服被判赔,关键在“身份”:豆包是通用助手,不是官方代言人。真正危险的,是普通人仍迷信“电脑不会错”。https://aitntnews.com/newDetail.html?newId=25070
写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
