腾讯大模型动作慢了吗？姚顺雨带着Hy3 preview杀进第一梯队

发布时间：2026-04-28来源：AIGC开放社区

专注AIGC技术的专业社区，关注大语言模型（LLM）的发展和应用落地，聚焦LLM及AI技术的市场研究和开发者生态，欢迎关注！

国内大模型发的飞起，作为国内一等一的大厂，腾讯在大模型上的动作显得慢了许多。

腾讯 AI 研发团队长期分布在不同事业群，研究、工程与模型能力并未完全统一，协同成本高。姚顺雨去年底加入腾讯任首席 AI 科学家。他曾在内部强调，要坚决打破部门墙。然后就是设立十年之久的 AI Lab 解散。

把地基挖开重新打底，需要极大的决心。

3 个多月前，腾讯混元团队推倒重来，把预训练、强化学习和基础设施全部重建。

重建后的 Hy3 preview 带着 295B 总参数和快慢思考融合架构开源登场，主打全面实用，将 Agent（智能体）能力与真实开发场景深度融合，各项性能表现优异。

姚顺雨表示，Hy3 preview是混元大模型重建的第一步。

晚点 LatePost 报道，姚顺雨曾在内部会议上指出，过去的混元模型过度追逐榜单成绩，将打榜的语料放入训练集以致数据被污染，影响了在真实场景中的表现。

他希望团队不要打榜，不要盯着榜单做事。

也因此，在 Hy3 preview 中，团队自建了50多个评测基准来评估模型的实际能力和落地性。一发布就整合进腾讯大生态。

追求模型与腾讯内部业务的贴合，让模型在实际应用中学习进化。

3个多月的时间，混元团队从预训练阶段的数据处理、强化学习的奖励机制、底层的算力基础设施，全部推倒重建。彻底重建孕育出了第一个成果 Hy3 preview。

它采用快慢思考融合的混合专家模型架构。总参数量达到 295B，每次处理任务时激活 21B 参数。

处理简单的日常对话，模型快速调用少量参数给出答案。遇到复杂的逻辑推理，模型放慢节奏，调动更多网络深度思考。搭配 256K 的上下文窗口，它成为混元迄今为止最智能的模型。

理工科高难度测试是检验逻辑能力的试金石。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等理工科榜单上表现亮眼。

在真实考场里，它同样交出优异答卷。清华大学求真书院2026年春季数学博士资格考中，它取得国内模型的最高分。全国中学生生物学联赛 CHSBO 2025 里，它也有优异表现。

团队提出了 CL-bench 和 CL-bench-Life 两个全新的基准。这两个基准创新性地评估模型的上下文学习能力。

在全新评估体系驱动下，Hy3 preview 的上下文学习能力和指令遵循能力获得显著提升。

Agent 是这次迭代中提升最明显的方向。写代码、查资料、调用外部工具完成任务，它真正具备了落地干活的能力。

面对跨网页对比、信息筛选和归纳等复杂的多步骤查找任务，它只需一步就能补齐所有操作。许多繁琐工作如今只需一句话就能完成。

比如开发游戏。给它一条指令：“我想做一个在小星球上采集建设的小游戏，玩家降落在云层上的荒芜小星球，通过摇杆移动，自动采集草木矿石，消耗资源自动建造。配以清新画面和轻快音效。”它能直接输出完整结果。

处理文档同样轻松。在腾讯文档AI助手开物AI中，扔给它一份数据报告，加上一句简单的要求，它直接提炼核心内容，生成一份排版精美的演示文稿。

开发微信小程序不再需要反复修改。一句话需求给到它，它一次性输出所有页面代码和配置文件。开发者把代码导入微信开发者工具直接就能预览效果，省去来回调试的烦恼。

面对群组里杂乱无章的微信聊天记录，它能抽丝剥茧，把对话中的意向和需求线索精准挖出来。不漏掉关键信息，不瞎猜用户意图，准确总结成清晰的待办事项。

代码能力和搜索能力共同决定模型在复杂智能体场景例如 OpenClaw 中是否真正好用。

在 SWE-Bench Verified、Terminal-Bench 2.0、BrowseComp、WideSearch 等主流评测中，它比上一代取得巨大提升，结果极具竞争力。

综合能力评测显示，它展现出高性价比。

在 ClawEval 和 WildClawBench 等评测中，表现同样突出。

为了覆盖真实开发场景，团队构建了多个内部评测集。

涵盖后端工程任务的 Hy-Backend、贴近真实用户开发交互的 Hy-Vibe Bench，以及高难度软件工程开发任务集 Hy-SWE Max。在这些高压测试环境下，它依然表现强劲。

Hy3 preview 的模型权重和代码已在 GitHub、HuggingFace、ModelScope、GitCode 等平台全面开源。支持 vLLM、SGLang 等主流推理框架，开发者可以直接下载部署。

模型架构与推理框架的深度协同，加上团队在推理框架、算子性能、量化算法等方面的持续优化，带来显著的性能红利。

官方表示推理效率提升 40%，使用成本相比上一代模型大幅下降。

推倒重建换来的是底层能力的全面升维，姚顺雨带领腾讯大语言模型杀进了第一梯队。

参考资料：

https://github.com/Tencent-Hunyuan/Hy3-preview

https://huggingface.co/tencent/Hy3-preview

https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview

https://ai.gitcode.com/tencent_hunyuan/Hy3-preview

END

点击图片立即报名👇️

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。