腾讯大模型动作慢了吗?姚顺雨带着Hy3 preview杀进第一梯队
国内大模型发的飞起,作为国内一等一的大厂,腾讯在大模型上的动作显得慢了许多。
腾讯 AI 研发团队长期分布在不同事业群,研究、工程与模型能力并未完全统一,协同成本高。 姚顺雨去年底加入腾讯任首席 AI 科学家。他曾在内部强调,要坚决打破部门墙。然后就是设立十年之久的 AI Lab 解散。
把地基挖开重新打底,需要极大的决心。
3 个多月前,腾讯混元团队推倒重来,把预训练、强化学习和基础设施全部重建。
重建后的 Hy3 preview 带着 295B 总参数和快慢思考融合架构开源登场,主打全面实用,将 Agent(智能体)能力与真实开发场景深度融合,各项性能表现优异。

姚顺雨表示,Hy3 preview是混元大模型重建的第一步。
晚点 LatePost 报道,姚顺雨曾在内部会议上指出,过去的混元模型过度追逐榜单成绩,将打榜的语料放入训练集以致数据被污染,影响了在真实场景中的表现。
他希望团队不要打榜,不要盯着榜单做事。
也因此,在 Hy3 preview 中,团队自建了50多个评测基准来评估模型的实际能力和落地性。一发布就整合进腾讯大生态。

追求模型与腾讯内部业务的贴合,让模型在实际应用中学习进化。
彻底重建的飞升
3个多月的时间,混元团队从预训练阶段的数据处理、强化学习的奖励机制、底层的算力基础设施,全部推倒重建。彻底重建孕育出了第一个成果 Hy3 preview。
它采用快慢思考融合的混合专家模型架构。总参数量达到 295B,每次处理任务时激活 21B 参数。
处理简单的日常对话,模型快速调用少量参数给出答案。遇到复杂的逻辑推理,模型放慢节奏,调动更多网络深度思考。搭配 256K 的上下文窗口,它成为混元迄今为止最智能的模型。
理工科高难度测试是检验逻辑能力的试金石。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等理工科榜单上表现亮眼。

在真实考场里,它同样交出优异答卷。清华大学求真书院2026年春季数学博士资格考中,它取得国内模型的最高分。全国中学生生物学联赛 CHSBO 2025 里,它也有优异表现。
团队提出了 CL-bench 和 CL-bench-Life 两个全新的基准。这两个基准创新性地评估模型的上下文学习能力。

在全新评估体系驱动下,Hy3 preview 的上下文学习能力和指令遵循能力获得显著提升。
贴地飞行
Agent 是这次迭代中提升最明显的方向。写代码、查资料、调用外部工具完成任务,它真正具备了落地干活的能力。
面对跨网页对比、信息筛选和归纳等复杂的多步骤查找任务,它只需一步就能补齐所有操作。许多繁琐工作如今只需一句话就能完成。
比如开发游戏。给它一条指令:“我想做一个在小星球上采集建设的小游戏,玩家降落在云层上的荒芜小星球,通过摇杆移动,自动采集草木矿石,消耗资源自动建造。配以清新画面和轻快音效。”它能直接输出完整结果。
处理文档同样轻松。在腾讯文档AI助手开物AI中,扔给它一份数据报告,加上一句简单的要求,它直接提炼核心内容,生成一份排版精美的演示文稿。
开发微信小程序不再需要反复修改。一句话需求给到它,它一次性输出所有页面代码和配置文件。开发者把代码导入微信开发者工具直接就能预览效果,省去来回调试的烦恼。

面对群组里杂乱无章的微信聊天记录,它能抽丝剥茧,把对话中的意向和需求线索精准挖出来。不漏掉关键信息,不瞎猜用户意图,准确总结成清晰的待办事项。

真实开发
代码能力和搜索能力共同决定模型在复杂智能体场景例如 OpenClaw 中是否真正好用。
在 SWE-Bench Verified、Terminal-Bench 2.0、BrowseComp、WideSearch 等主流评测中,它比上一代取得巨大提升,结果极具竞争力。

综合能力评测显示,它展现出高性价比。

在 ClawEval 和 WildClawBench 等评测中,表现同样突出。

为了覆盖真实开发场景,团队构建了多个内部评测集。

涵盖后端工程任务的 Hy-Backend、贴近真实用户开发交互的 Hy-Vibe Bench,以及高难度软件工程开发任务集 Hy-SWE Max。在这些高压测试环境下,它依然表现强劲。
Hy3 preview 的模型权重和代码已在 GitHub、HuggingFace、ModelScope、GitCode 等平台全面开源。支持 vLLM、SGLang 等主流推理框架,开发者可以直接下载部署。
模型架构与推理框架的深度协同,加上团队在推理框架、算子性能、量化算法等方面的持续优化,带来显著的性能红利。
官方表示推理效率提升 40%,使用成本相比上一代模型大幅下降。
推倒重建换来的是底层能力的全面升维,姚顺雨带领腾讯大语言模型杀进了第一梯队。
参考资料:
https://github.com/Tencent-Hunyuan/Hy3-preview
https://huggingface.co/tencent/Hy3-preview
https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview
https://ai.gitcode.com/tencent_hunyuan/Hy3-preview
END
点击图片立即报名👇️





