DeepSeek-V4 Pro API限时2.5折;豆包“提前查到2026山东事业编成绩”,最新回应;微博考核全体研发AI能力;某大模型泄露用户简历|AI周报

根据“大厂青年”消息,微博月底要举行全体研发 AI 能力考试了,考试内容是做个前后端的系统,AI 工具随便用,没限制。这波本来是移动端开发考前后端系统,前后端开发考 app 开发,后来觉得移动端搭环境太麻烦,干脆所有人统一考前后端。考不过的,拉去集中培训。
此外,字节部分部门已经开始搞 A to A 端到端全代码流程:从需求到上线,由 AI 来全程写代码,人在中间只负责 review 把关。据说有的组现在已经开始考核 AI 代码贡献率,并且直接写进了 OKR。
官方 API 文档显示,DeepSeek-V4-Pro 模型 API 限时 2.5 折优惠,优惠期截至 2026 年 5 月 5 日。
百万 tokens 输入(缓存命中)折后 0.25 元(原价 1 元);
百万 tokens 输入(缓存未命中)折后 3 元(原价 12 元);
百万 tokens 输出折后 6 元(原价 24 元)。

目前深度求索 DeepSeek V4 系列已获得广泛生态支持,其中英伟达于 4 月 25 日宣布 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型。DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens /sec/user,借助 vLLM 可在 Blackwell B300 上快速部署,预期性能将进一步提升。
此外,PPIO AI 云平台、华为云 MaaS 平台、中国联通的联通云与联通元景平台都在发布当天完成集成,天数智芯、寒武纪均完成了对两个版本的 Day 0 级适配,寒武纪的适配代码已开源至 GitHub 社区。
值得关注的是,在 DeepSeek-V4 长达 58 页的技术报告里,官方列出了一份近 300 人的“研究与工程”作者名单。近 300 个名字中,DeepSeek 创始人梁文锋的名字和所有研究员、工程师排在一起;同时,名单中有 10 人标注“已离职”,其中不乏王炳宣、魏浩然、郭达雅等核心骨干成员。

有观点认为,DeepSeek V4 的发布,标志着公司从单纯做大模型转向“模型 + 国产算力 + 商业化”的重资产路线;V4 明确将下半年昇腾 950 超节点规模化部署作为 Pro 版大幅降价的关键。
坊间关于 DeepSeek 融资前的估值数字一直在变化,还传出腾讯、阿里争抢入局的消息。4 月 23 日消息,一位接近 DeepSeek 的一线机构投资人士透露,DeepSeek 融前估值是 3000 亿人民币,约合 440 亿美元。
据扬子晚报报道,4 月 23 日晚间,有网友发帖称,“豆包查到 2026 山东事业编成绩了”,并附上一张成绩单,但成绩部分涂掉了。“不过好像只有济南槐荫区的能查,是不是属实咱也不知道,到底啥情况呀?”
4 月 24 日,记者联系上该网友了解到,帖子内容来自其他网友,但目前原帖网友已经删除了帖子。
据悉,1 月 22 日,济南市槐荫区人民政府官网发布 2026 年度济南市槐荫区所属事业单位公开招聘初级综合类岗位人员公告,考试分为笔试和面试,部分岗位增加试讲环节(中共济南市槐荫区委党校招聘岗位),笔试已于 3 月 22 日结束。
在网友发帖评论区,扬子晚报记者注意到,有网友表示,AI 搜集信息的能力很强大,“链接做好了还没公布,被 AI 爬出来了。”
扬子晚报记者拨打报名政策咨询电话,工作人员向记者解释了其中原委。“因为今天要发布笔试成绩,所以昨晚工作人员在测试成绩查询端口的时候,有网民无意中点进去了。”对方表示,“发现之后我们就及时关闭了测试的端口,并且今天上午我们已经将向社会发布了成绩公告,没有造成什么不良影响,谢谢大家的关注,也请大家理解和体谅,不要引起不必要的猜测。”
豆包有这么“神奇”吗?智灵动力(北京)科技有限公司副总裁郝雅婕分析告诉扬子晚报记者,应该是测试端口打开,被 AI 快速抓取到信息了。有可能豆包采集到往年的链接,按照往年链接的规律推断出来今年的成绩链接,可能和大模型幻觉和联想能力有关。
4 月 20 日,用户张呈在使用某大模型翻译英文 PPT 时,系统竟返回一份陌生人的完整简历,包含姓名、电话、邮箱、工作经历等真实信息。张呈通过简历上的电话联系到当事人钟先生,所有信息均能对应。张呈称,工作人员的解释是“AI 出现幻觉所致”。但浙江大学“百人计划”研究员韩蒙指出,这不属于典型“AI 幻觉”,“幻觉是‘胡说八道’,而这次是‘说对了,但不该说’”,更接近数据隔离失效、会话管理不当等工程链路问题。
律师王光英表示,该行为已构成个人信息泄露,平台不能以“AI 幻觉”作为免责理由,数据安全保护是平台的法定义务。张呈称今后不再向 AI 发送个人隐私信息。
近日,小米大模型团队负责人罗福莉在接受「语言即世界」访谈时,就当前大模型竞争格局、AI 智能体范式转变及 AGI 进程给出了一系列具体判断。罗福莉预计,AGI 将在两年内实现。她估计当前进度已完成约 20%,今年有望推进至 60% 到 70%。
罗福莉表示,目前国内已有包括 Kimi、MiMo 在内的多家公司具备 1T 参数以上的基座模型,中美两国在预训练阶段的差距“基本上已经没有”。她认为,国内团队在预训练结构上反而存在一定优势,只要对 Agent 范式的反应速度足够快,国内顶尖模型与 Claude Opus 4.6 等国际前沿模型之间的代差,实际上只有两三个月。
“接下来两三个月会非常精彩”,她说,这一窗口期将是对各家团队整体研究水平、技术敏捷度以及拥抱新范式能力的关键考验。罗福莉同时指出,大模型竞争已从预训练主导的 Chat 时代,全面转向后训练主导的 Agent 时代。1T 参数规模是当前实现接近顶尖 Agent 水平的“入场券”,而算力分配逻辑也随之逆转,顶尖团队的预训练与后训练算力投入比例已从过去的 5:1,收窄至今年的 1:1。
4 月 22 日,北京市东城区人民检察院披露了一起具有标志性的案件,一名程序员因私自删除公司 AI 训练数据,导致模型严重受损,最终被判处有期徒刑五年十个月。
2024 年 9 月,东城某科技公司算法工程师王某,为了使用公司的算力资源“干私活”,违规登录公司服务器集群,输入了行业内公认最危险的“删库跑路代码”指令,将公司 AI 游戏部门超过 89 TB 的训练数据和多个公司自主研发的文生 3D AI 模型全部删除。这一行为直接导致模型训练中断,部分已完成训练成果无法恢复,系统性能大幅下降。经评估,对企业造成了 20 余万元的经济损失,同时研发进度严重受阻。
王某将删除数据并下载与工作无关的数据模型,称是为了“程序员的自我提升”,但其难以解释为何删除了与其需求完全不匹配的大量数据。经过对嫌疑人手机数据进行集中分析筛查,从数十万条微信聊天记录中精准定位到王某与外部人员勾结,试图秘密使用公司算力资源“干私活”的关键证据。据悉,王某删除数据使用指令的含义是“无需确认,强制删除所有文件”,该指令是业内公认的危险指令,综合其从业经历、违规登录最终认定其具有明确的主观故意。案件历经三次庭审,最终当庭以破坏计算机信息系统罪,对王某判处有期徒刑五年十个月。
4 月 23 日消息,近日,Momenta 已向香港交易所递交上市申请,启动 IPO 工作。此次 IPO 工作前,Momenta 以 60 亿美元估值完成 Pre-IPO 轮融资。值得注意的是,伴随 IPO 工作开展消息的流出,Momenta 人员流失及感知算法等团队减员的消息也随之扩散开来。据传,此次减员或重点波及感知算法部门、数据平台部等部门,其中感知算法部门“137 人走人”,大部分是技术岗。
此外,Momenta 感知算法团队负责人曝出被“三倍薪资”挖角离职。“传统感知裁了,但端到端算法没裁”,一位深度接触过 Momenta 管理及技术人员的知情者对媒体证实此事,称由于 Momenta 去年开始在技术路线上押注“强化学习世界模型”,这导致了公司技术体系乃至管理团队的变动。不过也有业内人士分析,Momenta 此次人员调整,同样有着 IPO 前夕削减人员进而优化财务报表的嫌疑。参考 BOSS 直聘招聘信息,当前 Momenta 在招技术人员年薪普遍位于 56 万—100 万区间,部分高端岗位更是高达 150 万元,若减员百余人属实,仅此次减员便可为 Momenta 节省亿元人力成本支出。
4 月 23 日消息,有消息证实,GitHub Copilot 将于 6 月 1 日起转为按 Token 计费,官方公告预计将于本周发布。目前,GitHub Copilot 用户根据订阅套餐享有固定的“请求次数”额度,例如 Pro 套餐每月 300 次,Pro+ 套餐每月 1500 次。后续 GitHub Copilot 将不再以“请求次数”计费,改为按输入与输出 Token 的实际成本收费。举例来说,若选用 GPT-5.4 模型,开发者需为每百万输入 Token 支付 2.50 美元,每百万输出 Token 支付 15 美元。
用户仍需按月支付订阅费才能使用 GitHub Copilot 平台,但不再享有固定次数的高级请求额度,而是根据订阅等级获得对应数量的 AI Token。企业版 GitHub Copilot 用户将获得共享 AI 额度,可在组织内部统一调配使用。每月付费 19 美元的 GitHub Copilot Business 客户将获得价值 30 美元的共享 AI 额度,每月付费 39 美元的 Copilot Enterprise 客户则将获得价值 70 美元的共享 AI 额度。
4 月 22 日消息,据报道,Meta 将开始跟踪员工的工作方式,包括他们的击键和鼠标点击,以训练 AI 模型。Meta 公司周二告诉员工,一款新工具将在 Meta 的计算机和内部应用程序上运行,记录他们的活动,用作人工智能技术的训练数据。但一位不愿透露姓名的 Meta 员工表示,员工们在电脑上进行的最小操作都被用来训练 AI 模型,而与此同时,员工们还预计会有大量额外的裁员,这感觉“非常反乌托邦”。
4 月 21 日消息,亚马逊宣布向 Anthropic 追加 50 亿美元投资,并额外提供总计 6 吉瓦(GW)的 Trainium 芯片算力。亚马逊此前已向 Anthropic 投入 80 亿美元,如今再投 50 亿美元,累计达 130 亿美元。更长远看,亚马逊还计划未来继续追加 200 亿美元。
与亚马逊达成协议后,Anthropic 将在 2026 年之前使用 Trainium 芯片训练并部署其 Claude 模型,这能让 Anthropic 在 2026 年上半年就获得 5GW 算力,这些容量主要包括亚马逊的 Trainium2 算力。到 2026 年底,Anthropic 还将额外部署 1 吉瓦的算力,该算力搭载 Trainium2 和 Trainium3 芯片。从成本上看,Anthropic 将在未来 10 年内向亚马逊 AWS 投入超过 1000 亿美元。这笔长期订单覆盖 Trainium2、Trainium3、Trainium4 三代芯片。Anthropic 还可在亚马逊定制芯片的后续型号推出时,选择采购这些产品,
双方合作始于 2023 年。目前已有超过 10 万客户通过 Amazon Bedrock 平台运行 Claude 模型。双方共建的 Project Rainier 算力集群,是全球最大的计算集群之一,Anthropic 已在该集群中使用超过一百万颗 Trainium2 芯片进行模型训练和推理。凭借续签的协议,这一项目正迎来大规模升级改造。此外,有传闻称 Anthropic 还将引入 AMD 的 MI450 AI 加速器,作为算力补充。这项协议还帮助 Anthropic 满足其在亚洲和欧洲等其他地区 Claude 客户群体不断增长的需求。
此外,据彭博社报道,Google 计划向 Anthropic 投资最高 400 亿美元。根据 Anthropic 方面的说法,Google 将以 3500 亿美元的估值立即注入 100 亿美元现金,若 Anthropic 达成特定业绩目标,另外 300 亿美元将随后跟进。
在算力层面,Google Cloud 将在未来五年内为 Anthropic 提供 5 吉瓦的算力资源,后续或有更多吉瓦的容量跟进。这是本月早些时候 Anthropic、Google 与博通三方协议的进一步扩展。
美国时间 4 月 21 日,Cursor 授予 SpaceX 权利,允许其在今年晚些时候以 600 亿美元收购 Cursor,或就双方合作支付 100 亿美元。根据 SpaceX 在 X 上公布的消息,双方将在 GPU 算力上达成合作。xAI 旗下的 Colossus 超算系统拥有约 20 万张英伟达 GPU,正计划将其中数万张提供给 Cursor,用于训练下一代自研模型 Composer 2.5。
这是 AI 编程领域迄今规模最大的一次第三方算力合作,也是 xAI 并入 SpaceX 之后,首次尝试把算力变成对外出租的云服务。这不是传统意义上的收购公告,而是一种罕见的商业结构。马斯克用算力换来了一张对 Cursor 的“优先认购权”,而且把退出成本定得极高——如果 SpaceX 最终选择不行权,则需向 Cursor 支付 100 亿美元,作为双方合作的补偿。
4 月 21 日消息,苹果官网宣布,在执掌公司近二十年后,蒂姆・库克将卸任首席执行官一职,并出任执行董事长,该任命自今年 9 月 1 日起生效。接替库克的是约翰・特努斯,他目前担任这家科技巨头的硬件工程高级副总裁。就任 CEO 后,特努斯将加入苹果董事会。同日,苹果非执行董事长亚瑟・莱文森将出任这家 iPhone 制造商的首席独立董事。
苹果在新闻稿中表示:“库克将在夏季继续担任 CEO,与特努斯密切合作,确保平稳交接。”这是苹果自 2011 年以来首次 CEO 换届。现年 65 岁的库克当年在史蒂夫・乔布斯去世前不久接任掌舵,特努斯将成为苹果第八任首席执行官。
同期,库克在内部信中表示,自己将在今年内卸任 CEO 并转任董事长。他与特努斯深谈多次,发现他具有远见和卓越人格。“约翰是帮助我们迈向未来、开拓大胆新方向的合适领导者。”数据显示,库克从 2011 年管理苹果至今,公司市值从 3500 亿美元涨到约 4 万亿美元。
4 月 21 日,爱奇艺关联北京奇艺世纪科技有限公司公布“角色建议模型的训练方法及演员组合的确定方法”专利。该专利属于影视行业技术领域,核心功能是通过 AI 模型为影视作品智能推荐演员组合。其技术特点在于,不仅能筛选出个体符合角色设定的演员,更能综合考量演员之间的搭配契合度,确保推荐人选在整体上满足角色组合的表演需求。
4 月 21 日凌晨,爱奇艺发文重申,纳逗 Pro 艺人库是为 AIGC 创作者与艺人方提供高效对接沟通的规范化合作平台,不存在未经艺人同意将其纳入纳逗 Pro 艺人库的情况。而爱奇艺创始人龚宇也连发三条博文回应系列争议,希望大家不要断章取义。其中,对于“龚宇说未来真人实拍可能会成非遗”这个话题词,龚宇放出原视频,“我现场是这么说的:‘我们在考虑一件事,如果没有科技的含量的充斥,我们完全 100% 真实的物理的一些作品,或者一些形态的东西,会不会过多少年以后,被命名为世界文化遗产?就变成非遗(非物质文化遗产),这是一个问题啊。没有一个特别清晰的答案。’”
4 月 22 日,Nature 杂志发表论文:索尼 AI 研发的乒乓球机器人 Ace 在遵循国际乒联规则、由持证裁判执裁的正式比赛中,成功击败多名“人类精英选手”,13 场比赛赢下 7 场。这是 AI 机器人首次在需要物理互动的竞技体育中击败专业人类选手,被认为是继 AlphaGo 围棋之后,AI 在竞技领域的又一历史性突破。Ace 通过 9 个摄像头网络实现毫秒级轨迹预测,8 自由度机械臂完成击球。
不过在索尼高调的宣传背后,有网友质疑其宣传“成色不足”——毕竟乒乓球运动最顶端的选手并不都在日本。众所周知,在乒乓球这项被中国国家队长期且绝对垄断的运动中,公众语境里的“世界顶尖”早已与奥运冠军群体形成了严格的心理绑定。缺乏了这群最高级别“大魔王”作为检验标尺,球迷们本能地对其胜利成色打上了问号。
退休教授约翰·比林斯利批评称,Ace 战胜人类更多依靠的是硬件带来的巨大优势。他指出,人类选手只能依靠两只肉眼捕捉单一光源下的白球,而 Ace 却在球台四周密布了多达 9 台高速摄像机,构建了一个无死角的“上帝视角”来实时解算 3D 空间数据。依靠这种绝对的信息差碾压获取胜利,对人类而言显然有失公允。

4 月 24 日,OpenAI 正式发布旗下迄今最智能的 AI 模型 GPT-5.5。该模型核心突破在于大幅升级的 Agent 能力,能精准理解用户模糊指令,自主规划、调用工具并执行多步骤复杂任务,无需用户精细管控每一步流程,在 Agentic Coding、计算机使用、科研等领域表现卓越,相较前代模型,可在完成相同任务时显著降低 Token 消耗,以更少的指导完成更多任务。
性能层面,GPT-5.5 实现了智能水平与运行速度的平衡,尽管模型规模更大、能力更强,但其单 Token 延迟与 GPT-5.4 持平,同任务所需 Token 量大幅减少。在多项权威测试中,该模型表现亮眼:在 Artificial Analysis 的 Coding Index 中以竞品一半的成本实现 SOTA 水准,Terminal-Bench 2.0 测试准确率达 82.7%,SWE-Bench Pro 测试中拿下 58.6% 的成绩,Expert-SWE 等长周期任务表现均超越前代,同时在系统架构理解、故障定位等方面的能力也获得早期测试者的高度认可。
开放与定价方面,GPT-5.5 目前已向 OpenAI Plus、Pro 等用户开放使用,API 版本也即将上线。定价上,该模型基础版输入定价为每百万 Token 5 美元(约合人民币 34.2 元),Pro 版本输入定价为每百万 Token 30 美元。
GPT-5.5 的落地离不开 OpenAI 与英伟达的深度合作,该模型运行于 NVIDIA GB200 NVL72 机架级系统,为 Agent 编程应用 Codex 提供核心算力支撑。目前英伟达内部已有超 1 万名员工在工程、法务、市场等多部门率先使用该技术。
详情可阅读:GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex!
此外,OpenAI 于 4 月 22 日发布新一代图像生成模型 GPT Image 2,据官方介绍,这是 OpenAI 首个具备“思考”能力的图像模型。该模型通过底层架构重构,在准确率、分辨率、生成速度等方面实现突破性升级:中英文等文字准确率提升至 99%,支持复杂排版与多语言混排,可直接生成海报、试卷等含文字图像;原生支持 4096×4096 分辨率,输出 4K 高清图像,光影、材质细节达到摄影级,手部、人脸等传统“AI 灾区”伪影消失;单张图像生成仅需 3 秒,较上一代速度翻倍;内置知识库更新至 2025 年 12 月,可生成符合现实逻辑的 UI 界面、科学插图等。支持局部精准修改与多图批量生成,提升设计效率。
在权威评测平台 Text-to-Image Arena 中,GPT Image 2 以 1512 分断层领先第二名 242 分,碾压谷歌 Gemini Imagen 4 等竞品。免费用户可通过 ChatGPT 基础功能体验,付费用户(Plus/Pro)享有更高频次与“思考模式”,支持 API 调用。
4 月 23 日,腾讯正式发布混元 Hy3 preview 语言模型并宣布开源,这也是腾讯首席 AI 科学家姚顺雨入职近四个月后,交出的第一份模型答卷。据介绍,混元 Hy3 preview 是一款主打快慢思考融合的 MoE 语言模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度,官方称其整体性能达到同尺寸模型最佳水平。21B 的激活参数,为模型高频次、长链路的 Agent 调用提供了低成本的运行底座;而“快慢思考”的融合设计,天然适配复杂逻辑推理与多步工具调用场景,也就是姚顺雨提出的 ReAct(推理 - 行动)循环。
目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview 支持接入流行的开源 Agent 产品,如 OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台 TokenHub。
详情可阅读:姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview 登场 | 附实测
4 月 23 日报道,小米 MiMo 大模型一口气官宣 4 款新模型:旗舰推理模型 MiMo-V2.5、全模态 Agent 模型 V2.5-Pro 开启公测、即将开源;V2.5-TTS Series、V2.5-ASR 即将推出。小米 MiMo 大模型负责人正是原 DeepSeek 核心成员、被业内称为“天才少女”的罗福莉,这距离上次 MiMo-V2 系列重磅三连更仅 36 天。上一代模型发布时,罗福莉曾发文称“未来模型足够稳定后,他们将开源”。
与上一代模型类似,MiMo-V2.5 全系列同样是为 Agent 场景打造,MiMo-V2.5-Pro 专为长难 Agent 任务打造,MiMo-V2.5 可覆盖绝大多数通用 Agent 场景。小米还贴心为用户提供了官方使用指南:MiMo-V2.5 支持原生全模态 Agent 能力,涵盖图像、音频与视频,相比 Pro 版模型平均推理速度更快,更适应对时延敏感的任务。
除性能外,此次小米 MiMo 新模型还有一大升级点是更高的 Token 效率。根据官方信息,在拿到 Agent 基准榜单 ClawEval 相同分数的情况下:MiMo-V2.5-Pro 相比 Kimi 本周发布的开源旗舰多模态 Agent 模型 Kimi K2.6 节省了 42% Token;MiMo-V2.5 相比 Meta 本月初发布的闭源多模态推理模型 Muse Spark 节省了 50% Token。
此外,小米还全面升级了模型订阅计划 Token Plan:取消 4 倍的 Credits 计费方式、计费不区分 256k 和 1M 上下文、夜间享有专属优惠速率、新增自动续费模式。值得一提的是,其 Token Plan 计划刚发布时,就有不少用户吐槽价格太贵,便宜的套餐 Token 不够用。
4 月 21 日消息,月之暗面发布并开源了其最新模型 Kimi K2.6,该模型在代码编写、长程任务执行及 Agent 集群能力方面实现了全面升级。据官方披露,Kimi K2.6 在博士级难度的完整版“终极人类考试”(Humanity's Last Exam)、评估真实软件工程能力的 SWE-Bench Pro 以及 Agent 深度检索基准 DeepSearchQA 等测试中,均取得了行业领先的成绩,表现持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。
作为月之暗面迄今最强的代码模型,Kimi K2.6 的长程编码能力显著提升。在测试中,该模型可以不间断编码长达 13 小时,编写或修改超过 4000 行代码,完成复杂系统的开发与优化。
Kimi K2.6 现已面向所有免费用户、付费订阅用户、Kimi Code 和企业 API 用户开放。企业和开发者在 Kimi API 中指定模型为 kimi-k2.6 即可开始使用。
K2.6 模型上线后,因用户访问量激增,导致部分用户出现会员排队、功能短暂不可用的情况,同时后台系统在统计 Agent 额度时出现偏差,部分用户权益被误扣。月之暗面于 4 月 22 日 20:30 执行补偿措施,将所有用户当月的额度恢复至 100%,已使用的额度直接清零,确保用户能继续顺畅使用模型功能。
4 月 20 日消息,阿里发布 Qwen3.6-Max-Preview。权威三方评测榜单 Artificial Analysis 显示,Qwen3.6-Max-Preview 性能表现超过 GLM5.1、MiniMax-M2.7 等模型,登顶最佳国产模型。该模型是新一代千问旗舰模型的早期预览版,拥有更强的世界知识和指令遵循能力,并在 Agent 编程任务中性能显著提升。
另据报道,阿里 ATH 宣布,HappyHorse-1.0 将于 4 月 27 日通过阿里云百炼平台逐步开放 API 测试,首批邀测对象为企业级客户。阿里 ATH 方面透露,阿里巴巴在 AI 视频生成领域已深耕多年,HappyHorse 项目由 ATH 创新事业部主导,联合阿里平台技术、通义实验室及淘天技术等多个团队协同打造。4 月底开放测试后,HappyHorse-1.0 将于 5 月份正式发布商用。
同日,阿里巴巴发布端到端语音识别大模型 Fun-ASR1.5 ,无需预设语种标签,单一模型即可高精度识别 30 种语言。此前,Fun-ASR1.0 已用于钉钉 AI 听记、DingTalk A1 录音机等智能硬件。全新升级的 1.5 版本覆盖中文七大方言体系及二十余种地方口音,并强化古诗词诵读的专项识别,将应用场景拓宽至跨国企业、国际会议、多语直播、县域政务服务以及古诗词教育等。
字节跳动正式发布更高精度的新一代 3D 生成大模型——Seed3D 2.0。据介绍,该模型采用 MoE 架构,通过稀疏专家路由,在扩大模型参数量和分辨率的同时控制推理计算量,使模型能生成更丰富的纹理细节和更精确的金属 - 粗糙度边界。目前 Seed3D 2.0 技术报告已公开,API 也已上线火山引擎。
4 月 21 日,谷歌宣布基于 Gemini 3.1 Pro 打造的新一代自主研究 Agent Deep Research 与 Deep Research Max 正式上线。前者面向交互式场景,平衡速度与效率;后者则面向尽职调查等异步后台工作流,主打全面性与高质量综合输出。核心能力上,两款 Agent 支持搜索网络、任意远程 MCP 服务器、文件上传与企业连接存储,可将 Agent 从“网络搜索器”升级为能导航金融、市场数据等专业数据库的自主代理。输出层面首次支持原生生成高质量图表与信息图。新增功能还包括协作规划、扩展工具集与多模态研究基础的实时流式输出:用户可在执行前审查并优化 Agent 生成的研究计划,组合调用 Google 搜索、MCP、代码执行等工具。
4 月 23 日,谷歌在 Google Cloud Next 大会上,正式发布第八代 TPU 芯片家族,首次将训练与推理能力拆分为 TPU 8t 与 TPU 8i 两款独立产品,直指英伟达在 AI 算力市场的霸主地位。在训练侧,TPU 8t 面向大规模、高强度计算任务,官方宣称在大规模训练场景下相对上一代 Ironwood 实现了高达 2.7 倍的单位美元性能提升。其 Pod 规模由 9216 颗芯片扩展至 9600 颗,FP4 总算力接近翻倍,单芯片横向扩展带宽则从 100Gbps 提升至 400Gbps。TPU 8i 则面向推理与 Agent 工作负载,每颗芯片配备 384MB SRAM,是 Ironwood 的三倍;在服务超大规模 MoE 前沿模型、低延迟目标下,单位美元推理性能较上一代提升约 80%,Pod 规模由 256 颗提升至 1152 颗。谷歌表示,两款芯片预计将在 2026 年晚些时候面向云客户全面开放。
4 月 20 日,蚂蚁灵光 App 完成闪应用功能大升级,推出“灵光圈”,致力于打造人人可用的消费级 Coding Agent。在原有“30 秒生应用”基础上,灵光闪应用持续强化多 Agent 协作、全模态生成及移动端原生能力集成,成为首个支持用户用自然语言,在手机端创建、分发、使用、迭代 AI 应用的平台,真正实现了 0 代码、0 部署、0 门槛个性化创作。
同一天,灵光 App 宣布启动“灵光闪应用创作者激励计划”,将投入 1 亿元专项基金,扶持优质闪应用和优秀创作者。该计划于 4 月 20 日启动:每天最高 100 万激励 10000 个优质闪应用;每周最高 100 万激励 100 名优秀创作者。用户在灵光 App 生成闪应用,并发布到灵光圈即可参加评选。灵光希望通过产品迭代和创作激励,持续降低大众用户的创作门槛,加速 “一人应用”生态的涌现。
4 月 22 日,特斯拉车机语音服务将接入豆包大模型。此前,特斯拉中国官网的《特斯拉车机语音助手使用条款》显示,特斯拉 Model Y L 车型将搭载豆包大模型与 DeepSeek 模型,两款模型均通过火山引擎接入。
4 月 21 日,火山引擎宣布,Seedance 2.0 API 服务现已支持 1080P 全高清视频生成。据介绍,该能力为模型原生能力,可直接在 1080P 分辨率下完成画面构建,在更高清晰度下,画面细节密度与光影层次显著提升。
4 月 21 日,小米宣布上线 PC、Mac 和有屏音箱版 Xiaomi miclaw,并开启小范围封测。Xiaomi miclaw 是基于小米 MiMo 大模型构建的 AI 交互测试产品,也是国内首款手机端 AI Agent 应用,于 3 月 6 日上线并开启小范围封测。
4 月 21 日,荣威于品牌之夜上正式发布了与火山引擎深度合作的战略成果——全球首个 AI 原生汽车序列“家越”,并携家越 07、家越 06、家越 09 三款概念车联袂亮相。此次荣威与火山引擎的合作实现全面升级,在 AI 原生技术架构、智能座舱、车云一体化等领域展开深度联合开发,共同构建技术底座。
世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?安全与可信这道坎怎么过?研发体系不重构,还能撑多久?
AICon 上海站 2026,4 大核心专题等你来:世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构。14 个专题全面开放征稿。
诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。

今日荐文
印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来
Claude变笨,Anthropic发报告认了:为优化3个Harness层bug,不小心改崩了
DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权
GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex!

