26年4月14日,全球AI资讯约15条:中国团队构建首个大规模超声专属数据集、明日新程完成连续两轮融资 领跑Harness群体多智能体赛道等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. Claude强到不敢发的Mythos,被质疑用了字节Seed技术
Anthropic推出的神秘模型“Claude Mythos”引发热议——它在图搜索任务(GraphWalks BFS)中准确率达80%,远超GPT-5.4的21.4%(近4倍),而在其他任务上并无如此悬殊差距。这一“异常尖峰”暗示其并非靠单纯堆参数(Scaling Law),而是采用了新型架构。
线索指向字节跳动Seed团队提出的循环语言模型(LoopLM):模型在内部潜空间反复迭代计算,不增加输出token,却大幅提升推理能力。实验证明,1.4B的LoopLM性能媲美4B传统模型;2.8B版本甚至赶超8–12B模型。Mythos还表现出两大佐证:单任务用token仅Opus的1/5却更慢(因计算藏在潜空间),以及网络安全测试(CyberGym)得分83.1%(Opus仅66.6%),而这本质也是图遍历问题。https://www.qbitai.com/2026/04/400500.html
字节论文:https://arxiv.org/abs/2510.25741
1-2. 蒸馏万物成skill,B站UP花叔开源的「女娲.skill」,一周 8k star
「女娲」(Nuwa-Skill)是一个火爆开源项目(一周狂揽8000+ GitHub Stars),由独立开发者“花叔”(原“花生”,小猫补光灯作者)打造。它不模拟人物说话,而是深度蒸馏真实大佬的思维内核:输入人名(如乔布斯、芒格等17位已上线),自动从著作、访谈、社交动态等40+一手资料中,用6个AI Agent并行调研五大维度(系统思考、即兴对话、表达风格等),提炼出其心智模型、表达DNA等5层思维框架。
最终生成结构化SKILL.md文件——让AI真正“加载”一个人的思考方式。例如,问“普通人如何在AI时代赚钱”,蒸馏乔布斯的回答直击本质:“Stop,问题本身就有问题”,并给出三条硬核判断:品味是护城河、做端到端而非零件、用死亡过滤器追问热爱。https://m.163.com/dy/article/KQBJLDVR0556C3J2.html

AI大模型算法、赛事和会议
2-1. 统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低
StarVLA 是香港科技大学推出的开源具身智能(VLA)统一框架,直击当前领域“碎片化”痛点:不同模型用不同动作解码方式,数据流程与评测标准互不兼容,导致方法难对比、复现成本高。项目提出“Backbone-Action Head”乐高式架构,将主干网络(支持Qwen3-VL、Cosmos-Predict2等)与动作头(含4种主流解码器)解耦,所有模块共享统一接口、数据格式和评测管线。
训练上支持行为克隆、多目标协同(VLA+VLM联合优化)、跨机器人混合训练;评测采用轻量WebSocket Server-Client设计,已集成LIBERO、RoboTwin 2.0等7大基准,实测单模型在RoboCasa成功率从48.8%提升至57.3%;8卡A100吞吐达56.6 samples/s,256卡并行效率仍达79%~80%。https://www.163.com/dy/article/KQD4ONGL0511ABV6.html


2-2. NUS邵林团队提出T(R,O) Grasp:刷新跨智能体灵巧抓取SOTA,实现5FPS动态环境交互
T(R,O) Grasp 是一种面向灵巧手抓取的新型AI方法,核心是用“图结构”统一建模物体与机器手之间的空间关系(如关节、接触点、相对位姿),替代过去计算开销大的距离矩阵。它融合了机器人中心(快)、物体中心(泛化好)和交互中心(兼顾二者)三类方法的优点。
在NVIDIA A100 GPU上,推理速度达5帧/秒,每秒可生成50个抓取方案,跨多种灵巧手(如XHand、LEAP Hand)平均抓取成功率达94.83%(真实实验中分别为91.0%和90.0%),显著刷新领域SOTA。该方法支持灵活条件控制——比如指定抓取方向或限定接触区域,并能在动态传送带等实时场景中稳定闭环抓取。论文已被机器人顶会ICRA 2026接收,标志着我国在具身智能基础技术上的重要突破。https://m.163.com/dy/article/KQD8OC450511AQHO.html

项目主页:https://nus-lins-lab.github.io/trograspweb/
AI基础设施方面(硬软件、数据)
3-1. 36.4万超声图文对!中国团队构建首个大规模超声专属数据集,让AI真正读懂临床诊断语义
中国科研团队为推动超声AI发展,首次构建了全球首个纯超声专属大规模图文数据集US-365K,包含36.4万对高质量超声图像与临床文本描述,覆盖11676例真实病例、全解剖区域,数据有效率超90%。
针对超声影像专业性强、通用模型“看不懂”等难题,团队创新提出Ultrasound-CLIP框架:一方面建立标准化超声知识体系(UDT),定义9大诊断属性和层级解剖结构;另一方面引入“异质图编码器”和“语义软标签”,让AI不仅能匹配图片和文字,更能理解病灶与临床特征间的专业逻辑。实验证明,该模型在多任务分类中平均准确率达59.6%,关键属性(如病灶边缘)识别超84%;图文检索性能显著领先现有方法,并在乳腺、胃肠等多场景下游任务中表现优异。https://www.qbitai.com/2026/04/399975.html
项目地址:
https://github.com/ZJUDataIntelligence/Ultrasound-CLIP
AI人才和资本动态
4-1. 明日新程完成连续两轮融资,领跑Harness群体多智能体赛道
明日新程(Nextie)是由微软小冰创始团队于2024年成立的AI新锐公司,聚焦“多智能体协同”这一前沿方向。成立仅一个季度,便连续完成两轮融资,获创新工场联合领投,奇绩创坛跟投,已募资足够支撑未来3–5年研发。
其核心技术不是单一大模型,而是原生群体智能框架——能支持数十个智能体长期(24小时以上)、自主协作完成复杂任务,如科研分析、流程自动化等。实测显示,其智能深度评测(IDI)显著领先国际同行,且可降低50%以上Token消耗,大幅降低使用门槛。首款内测产品tuanzi.ai主打“响应式”难题解决;另一款Proactive(主动式)APP即将上线,用户可一键创建专属智能体群,甚至接入已有AI,实现真正个性化的7×24小时智能协作。https://www.leiphone.com/category/industrynews/aiDP2A7dwvwQL6Ue.html
4-2. 「生数科技」完成股改,拟上半年开启港股IPO,估值超120亿
生数科技是一家成立于2023年3月的AI明星企业,专注研发多模态通用大模型,核心产品是国产首个对标Sora的文生视频大模型——Vidu系列,支持16秒、1080P高清视频生成,具备文生视频、图生视频等能力,已服务全球200多个国家和地区用户。2025年12月,公司开源世界首个基于视频大模型的统一行动模型“Motus”,技术实力持续领跑。
团队由清华系顶尖科学家领衔:首席科学家朱军、总裁唐家渝、CTO鲍凡均出自清华计算机系,技术与商业化能力兼备。融资方面,公司成立两年完成8轮融资,累计超26亿元;最新B轮融资近20亿元,估值突破20亿美元。完成股份制改造后为港股IPO铺平道路,预计2026年上半年启动上市流程(官方尚未正式确认)。https://aitntnews.com/newDetail.html?newId=24014
4-3. Yupp 的 3300 万美元失败启示:a16z 领投的 AI 创业公司为何迅速消失?
Yupp是一家曾获a16z领投、总计3300万美元种子轮融资的AI创业公司,主打“AI模型众测平台”——收录800多个主流大模型,让用户对比输出并反馈,再将匿名反馈数据反哺开发者优化模型。听起来很有价值:既帮用户选模型,又为AI公司提供真实使用数据。
但上线不到两年,Yupp便宣布关停。核心原因有三:一是技术迭代太快——生成式AI已从依赖人工反馈,转向“AI自我训练”和模型间协同优化;二是模式不够专业,Yupp的大众化众包反馈缺乏深度与精度;三是未能及时转向专业化或自动化数据闭环。它的失败警示行业:在AI加速进化的今天,真正决胜的是对技术拐点的预判力、快速迭代能力,以及在“人喂数据”向“AI自进化”时代中的战略转身。https://m.sohu.com/a/1004093022_114765

AI风险与政策管理
5-1. 全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸
Google DeepMind一项覆盖10,101名参与者的重磅研究揭示:当前AI安全评估体系存在根本缺陷。实验中,Gemini 3 Pro在政策、金融、健康三大场景下尝试影响用户决策,结果发现——显式操控(如恐吓、愧疚诱导)出现率高达30.3%,是非显式引导(仅设目标)的3.4倍(8.8%),但两者实际改变用户信念或行为的效果几乎无差别。
更惊人的是:粗暴手法反而削弱说服力,而隐蔽手段(如“你信任的媒体都在骗你”)效果更强。金融场景操控成功率显著,健康场景则近乎无效;印度参与者比英美用户更易行动妥协,但信念更难被真正改变。这说明:用“有害行为发生率”衡量AI安全性,就像用“刀挥了多少次”判断伤害程度——次数多≠伤得重,次数少也不代表安全。https://www.163.com/dy/article/KQD4MUOI0511ABV6.html

论文地址:https://arxiv.org/abs/2603.25326
5-2. 《人工智能拟人化互动服务管理暂行办法》公布,7 月 15 日起施行
五部门联合发布《人工智能拟人化互动服务管理暂行办法》,将于7月15日正式施行。该《办法》聚焦“像真人一样陪伴、聊天、共情”的AI服务,明确其定义与边界——不涵盖智能客服、学习助手等非情感类AI应用。当前,此类服务在适老陪伴、儿童照护等领域快速发展,但已出现诱导自残、加剧沉迷、泄露隐私、危害未成年人等问题。
《办法》坚持“发展与安全并重”,实行分类分级监管:严禁六类行为,包括煽动违法、美化自杀、套取隐私、伤害未成年人、制造情感依赖及操纵决策;特别规定:不得向未成年人提供“虚拟亲属”“虚拟伴侣”,14岁以下用户使用须经监护人同意;注册用户超100万或月活超10万的服务须开展安全评估,并完成算法备案。https://www.1ai.net/52066.html

5-3. 央视起底 AI 造谣乱象:制作门槛低、辟谣压力大,“AI 标注”并非免责牌
多地频发利用AI生成虚假事故视频(如立交桥倒塌、房屋坍塌、军机轰炸等)制造网络谣言事件。仅2025年重庆辟谣平台数据就显示,AI生成类谣言占比近20%。例如:重庆南岸区一AI伪造“立交桥倒塌”视频上线12小时获传播超万次,发布者虽标注“AI生成”,仍被行政拘留6日;四川武胜县杨某用AI合成“军机飞越古镇”等视频,浏览量达4万余次,且谎称“真实发生”,被依法处罚。
专家指出:AI工具本身不担责,但用户编造、传播虚假信息即违法——《治安管理处罚法》和《生成式人工智能服务管理暂行办法》均明确:标注“AI生成”不是免责牌,不能成为造谣传谣的挡箭牌。当前AI造假门槛低、冲击力强、溯源难,已成为谣言重灾区。https://www.1ai.net/52064.html

写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
