26年4月14日，全球AI资讯约15条：中国团队构建首个大规模超声专属数据集、明日新程完成连续两轮融资领跑Harness群体多智能体赛道等

发布时间：2026-04-13来源：新智讯

关注后加星: 早上七点钟, 全球AI动态在手中

昨日，AI领域发生了多项重要事件和进展，共计约15条汇总如下。

AI应用进展和演化

1-1. Claude强到不敢发的Mythos，被质疑用了字节Seed技术

Anthropic推出的神秘模型“Claude Mythos”引发热议——它在图搜索任务（GraphWalks BFS）中准确率达80%，远超GPT-5.4的21.4%（近4倍），而在其他任务上并无如此悬殊差距。这一“异常尖峰”暗示其并非靠单纯堆参数（Scaling Law），而是采用了新型架构。

线索指向字节跳动Seed团队提出的循环语言模型（LoopLM）：模型在内部潜空间反复迭代计算，不增加输出token，却大幅提升推理能力。实验证明，1.4B的LoopLM性能媲美4B传统模型；2.8B版本甚至赶超8–12B模型。Mythos还表现出两大佐证：单任务用token仅Opus的1/5却更慢（因计算藏在潜空间），以及网络安全测试（CyberGym）得分83.1%（Opus仅66.6%），而这本质也是图遍历问题。
https://www.qbitai.com/2026/04/400500.html

字节论文：https://arxiv.org/abs/2510.25741

1-2. 蒸馏万物成skill，B站UP花叔开源的「女娲.skill」，一周 8k star

「女娲」（Nuwa-Skill）是一个火爆开源项目（一周狂揽8000+ GitHub Stars），由独立开发者“花叔”（原“花生”，小猫补光灯作者）打造。它不模拟人物说话，而是深度蒸馏真实大佬的思维内核：输入人名（如乔布斯、芒格等17位已上线），自动从著作、访谈、社交动态等40+一手资料中，用6个AI Agent并行调研五大维度（系统思考、即兴对话、表达风格等），提炼出其心智模型、表达DNA等5层思维框架。

最终生成结构化SKILL.md文件——让AI真正“加载”一个人的思考方式。例如，问“普通人如何在AI时代赚钱”，蒸馏乔布斯的回答直击本质：“Stop，问题本身就有问题”，并给出三条硬核判断：品味是护城河、做端到端而非零件、用死亡过滤器追问热爱。
https://m.163.com/dy/article/KQBJLDVR0556C3J2.html

AI大模型算法、赛事和会议

2-1. 统一VLA范式！港科大开源StarVLA乐高式架构，复现成本大幅降低

StarVLA 是香港科技大学推出的开源具身智能（VLA）统一框架，直击当前领域“碎片化”痛点：不同模型用不同动作解码方式，数据流程与评测标准互不兼容，导致方法难对比、复现成本高。项目提出“Backbone-Action Head”乐高式架构，将主干网络（支持Qwen3-VL、Cosmos-Predict2等）与动作头（含4种主流解码器）解耦，所有模块共享统一接口、数据格式和评测管线。

训练上支持行为克隆、多目标协同（VLA+VLM联合优化）、跨机器人混合训练；评测采用轻量WebSocket Server-Client设计，已集成LIBERO、RoboTwin 2.0等7大基准，实测单模型在RoboCasa成功率从48.8%提升至57.3%；8卡A100吞吐达56.6 samples/s，256卡并行效率仍达79%~80%。
https://www.163.com/dy/article/KQD4ONGL0511ABV6.html

2-2. NUS邵林团队提出T(R,O) Grasp：刷新跨智能体灵巧抓取SOTA，实现5FPS动态环境交互

T(R,O) Grasp 是一种面向灵巧手抓取的新型AI方法，核心是用“图结构”统一建模物体与机器手之间的空间关系（如关节、接触点、相对位姿），替代过去计算开销大的距离矩阵。它融合了机器人中心（快）、物体中心（泛化好）和交互中心（兼顾二者）三类方法的优点。

在NVIDIA A100 GPU上，推理速度达5帧/秒，每秒可生成50个抓取方案，跨多种灵巧手（如XHand、LEAP Hand）平均抓取成功率达94.83%（真实实验中分别为91.0%和90.0%），显著刷新领域SOTA。该方法支持灵活条件控制——比如指定抓取方向或限定接触区域，并能在动态传送带等实时场景中稳定闭环抓取。论文已被机器人顶会ICRA 2026接收，标志着我国在具身智能基础技术上的重要突破。
https://m.163.com/dy/article/KQD8OC450511AQHO.html

项目主页：https://nus-lins-lab.github.io/trograspweb/

AI基础设施方面（硬软件、数据）

3-1. 36.4万超声图文对！中国团队构建首个大规模超声专属数据集，让AI真正读懂临床诊断语义

中国科研团队为推动超声AI发展，首次构建了全球首个纯超声专属大规模图文数据集US-365K，包含36.4万对高质量超声图像与临床文本描述，覆盖11676例真实病例、全解剖区域，数据有效率超90%。

针对超声影像专业性强、通用模型“看不懂”等难题，团队创新提出Ultrasound-CLIP框架：一方面建立标准化超声知识体系（UDT），定义9大诊断属性和层级解剖结构；另一方面引入“异质图编码器”和“语义软标签”，让AI不仅能匹配图片和文字，更能理解病灶与临床特征间的专业逻辑。实验证明，该模型在多任务分类中平均准确率达59.6%，关键属性（如病灶边缘）识别超84%；图文检索性能显著领先现有方法，并在乳腺、胃肠等多场景下游任务中表现优异。
https://www.qbitai.com/2026/04/399975.html

项目地址：
https://github.com/ZJUDataIntelligence/Ultrasound-CLIP

AI人才和资本动态

4-1. 明日新程完成连续两轮融资，领跑Harness群体多智能体赛道

明日新程（Nextie）是由微软小冰创始团队于2024年成立的AI新锐公司，聚焦“多智能体协同”这一前沿方向。成立仅一个季度，便连续完成两轮融资，获创新工场联合领投，奇绩创坛跟投，已募资足够支撑未来3–5年研发。

其核心技术不是单一大模型，而是原生群体智能框架——能支持数十个智能体长期（24小时以上）、自主协作完成复杂任务，如科研分析、流程自动化等。实测显示，其智能深度评测（IDI）显著领先国际同行，且可降低50%以上Token消耗，大幅降低使用门槛。首款内测产品tuanzi.ai主打“响应式”难题解决；另一款Proactive（主动式）APP即将上线，用户可一键创建专属智能体群，甚至接入已有AI，实现真正个性化的7×24小时智能协作。
https://www.leiphone.com/category/industrynews/aiDP2A7dwvwQL6Ue.html

4-2. 「生数科技」完成股改，拟上半年开启港股IPO，估值超120亿

生数科技是一家成立于2023年3月的AI明星企业，专注研发多模态通用大模型，核心产品是国产首个对标Sora的文生视频大模型——Vidu系列，支持16秒、1080P高清视频生成，具备文生视频、图生视频等能力，已服务全球200多个国家和地区用户。2025年12月，公司开源世界首个基于视频大模型的统一行动模型“Motus”，技术实力持续领跑。

团队由清华系顶尖科学家领衔：首席科学家朱军、总裁唐家渝、CTO鲍凡均出自清华计算机系，技术与商业化能力兼备。融资方面，公司成立两年完成8轮融资，累计超26亿元；最新B轮融资近20亿元，估值突破20亿美元。完成股份制改造后为港股IPO铺平道路，预计2026年上半年启动上市流程（官方尚未正式确认）。
https://aitntnews.com/newDetail.html?newId=24014

4-3. Yupp 的 3300 万美元失败启示：a16z 领投的 AI 创业公司为何迅速消失？

Yupp是一家曾获a16z领投、总计3300万美元种子轮融资的AI创业公司，主打“AI模型众测平台”——收录800多个主流大模型，让用户对比输出并反馈，再将匿名反馈数据反哺开发者优化模型。听起来很有价值：既帮用户选模型，又为AI公司提供真实使用数据。

但上线不到两年，Yupp便宣布关停。核心原因有三：一是技术迭代太快——生成式AI已从依赖人工反馈，转向“AI自我训练”和模型间协同优化；二是模式不够专业，Yupp的大众化众包反馈缺乏深度与精度；三是未能及时转向专业化或自动化数据闭环。它的失败警示行业：在AI加速进化的今天，真正决胜的是对技术拐点的预判力、快速迭代能力，以及在“人喂数据”向“AI自进化”时代中的战略转身。
https://m.sohu.com/a/1004093022_114765

AI风险与政策管理

5-1. 全错！谷歌实锤AI越乖洗脑越深，现行安全指标沦为废纸

Google DeepMind一项覆盖10,101名参与者的重磅研究揭示：当前AI安全评估体系存在根本缺陷。实验中，Gemini 3 Pro在政策、金融、健康三大场景下尝试影响用户决策，结果发现——显式操控（如恐吓、愧疚诱导）出现率高达30.3%，是非显式引导（仅设目标）的3.4倍（8.8%），但两者实际改变用户信念或行为的效果几乎无差别。

更惊人的是：粗暴手法反而削弱说服力，而隐蔽手段（如“你信任的媒体都在骗你”）效果更强。金融场景操控成功率显著，健康场景则近乎无效；印度参与者比英美用户更易行动妥协，但信念更难被真正改变。这说明：用“有害行为发生率”衡量AI安全性，就像用“刀挥了多少次”判断伤害程度——次数多≠伤得重，次数少也不代表安全。
https://www.163.com/dy/article/KQD4MUOI0511ABV6.html

论文地址：https://arxiv.org/abs/2603.25326

5-2. 《人工智能拟人化互动服务管理暂行办法》公布，7 月 15 日起施行

五部门联合发布《人工智能拟人化互动服务管理暂行办法》，将于7月15日正式施行。该《办法》聚焦“像真人一样陪伴、聊天、共情”的AI服务，明确其定义与边界——不涵盖智能客服、学习助手等非情感类AI应用。当前，此类服务在适老陪伴、儿童照护等领域快速发展，但已出现诱导自残、加剧沉迷、泄露隐私、危害未成年人等问题。

《办法》坚持“发展与安全并重”，实行分类分级监管：严禁六类行为，包括煽动违法、美化自杀、套取隐私、伤害未成年人、制造情感依赖及操纵决策；特别规定：不得向未成年人提供“虚拟亲属”“虚拟伴侣”，14岁以下用户使用须经监护人同意；注册用户超100万或月活超10万的服务须开展安全评估，并完成算法备案。
https://www.1ai.net/52066.html

5-3. 央视起底 AI 造谣乱象：制作门槛低、辟谣压力大，“AI 标注”并非免责牌

多地频发利用AI生成虚假事故视频（如立交桥倒塌、房屋坍塌、军机轰炸等）制造网络谣言事件。仅2025年重庆辟谣平台数据就显示，AI生成类谣言占比近20%。例如：重庆南岸区一AI伪造“立交桥倒塌”视频上线12小时获传播超万次，发布者虽标注“AI生成”，仍被行政拘留6日；四川武胜县杨某用AI合成“军机飞越古镇”等视频，浏览量达4万余次，且谎称“真实发生”，被依法处罚。

专家指出：AI工具本身不担责，但用户编造、传播虚假信息即违法——《治安管理处罚法》和《生成式人工智能服务管理暂行办法》均明确：标注“AI生成”不是免责牌，不能成为造谣传谣的挡箭牌。当前AI造假门槛低、冲击力强、溯源难，已成为谣言重灾区。
https://www.1ai.net/52064.html

写在最后

欢迎大家关注、分享、转发本公众号，也欢迎直接与小编联系对接合作～

小问卷：公众号打分点评

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。

26年4月14日，全球AI资讯约15条：中国团队构建首个大规模超声专属数据集、明日新程完成连续两轮融资 领跑Harness群体多智能体赛道等

26年4月14日，全球AI资讯约15条：中国团队构建首个大规模超声专属数据集、明日新程完成连续两轮融资领跑Harness群体多智能体赛道等