小米开源模型首日登顶全球榜首,百万亿Token免费送

4月28日凌晨,小米技术官方宣布旗舰大模型MiMo-V2.5-Pro及全模态模型MiMo-V2.5正式全球开源。 该系列模型权重已全量开放于Hugging Face等平台,采用宽松的MIT协议,允许全球开发者自由商用、微调及二次训练,无需额外授权。与此同时,小米推出MiMo Orbit计划,宣布于30天内面向全球开发者发放总计100万亿免费Token权益,并与OpenCode、Hermes Agent、KiloCode等Agent框架团队展开生态共建合作。

双版本覆盖Agent与全模态场景
MiMo-V2.5系列包含两款模型,均支持100万Token超长上下文窗口,但定位各有侧重:
·MiMo-V2.5-Pro:旗舰Agent模型,面向复杂任务场景,深度适配Agent与Coding应用。据小米公布的模型卡,该模型为拥有1.02万亿(1.02T)总参数、420亿(42B)激活参数的混合专家(MoE)架构,基于混合注意力架构设计。其预训练使用了27万亿Token,采用FP8混合精度,原生序列长度32K,后扩展至1M Token。技术细节上,局部滑动窗口注意力(SWA)与全局注意力(GA)以6:1比例交错使用,窗口大小为128 Token;同时继承并优化了多标记预测(MTP)机制,通过轻量级密集前馈神经网络模块,将输出吞吐量提升约三倍。

·MiMo-V2.5:原生全模态模型,支持文本、图像、视频和音频理解,具备强大的Agent能力。该模型为3100亿(310B)总参数、150亿(15B)激活参数的稀疏MoE模型,在48万亿Token上完成预训练。其语言主干继承混合滑动窗口注意力机制,并搭载自研预训练视觉与音频编码器,通过轻量化投影模块实现跨模态融合。

在后训练阶段,MiMo-V2.5-Pro遵循三阶段范式:监督式微调建立基础指令跟踪能力;领域专精训练通过强化学习分别优化数学、安全、智能工具使用等能力;最终通过多教师策略蒸馏(MOPD)将各领域能力融合至统一模型。MiMo-V2.5则经历五阶段训练,涵盖文本预训练、投影层预热、多模态预训练、上下文逐步扩容(32K→256K→1M)以及强化学习与多目标偏好蒸馏。
多项基准测试榜单登顶,对标全球顶级闭源模型
根据小米官方公布的Benchmark Results及多家媒体报道,MiMo-V2.5系列在多项权威测评中表现突出:

·GDPVal-AA(Elo):MiMo-V2.5-Pro以1581分、MiMo-V2.5以1559分位列全球开源模型第一;
·Claw-Eval(pass^3):MiMo-V2.5-Pro以63.8%位列全球开源模型第一,在任务完成率与Token效率维度上处于最优前沿;
·t³-bench:MiMo-V2.5-Pro得分72.9,全球开源第一;
·SWE-bench Pro:MiMo-V2.5-Pro得分57.2,超过DeepSeek V4 Pro的55.4与Gemini 3.1 Pro的54.2;
·MiMo Coding Bench:MiMo-V2.5-Pro得分73.7,领先于Gemini 3.1 Pro的67.8;
·Terminal-Bench 2.0:MiMo-V2.5-Pro得分68.4,优于MiMo-V2-Pro的57.1与DeepSeek V4 Pro的67.9。

在Artificial Analysis综合智能指数榜单中,MiMo-V2.5-Pro发布当天即位列全球开源大模型并列第一,同时Agent专项指数开源第一,跻身全球所有大模型(含闭源)总榜前五。小米方面指出,在通用智能体能力、复杂软件工程以及长程任务等核心维度上,MiMo-V2.5-Pro已可对标Claude Opus 4.6、GPT-5.4等全球顶级Agent模型,且推理成本仅为国际闭源旗舰的2.5%。

值得注意的是,智东西等媒体报道称,MiMo-V2.5-Pro在GDPVal-AA、Claw-Eval、t³-bench等多项测评中超过了最新开源的DeepSeek-V4-Pro模型,也超过了Kimi K2.6等主流闭源模型。


国产芯片与推理框架Day 0适配:开源即部署
MiMo-V2.5-Pro于开源首日即完成与多家国内外主流芯片厂商的深度适配,实现了"开源即部署"的产业落地能力:

此外,MiMo-V2.5系列模型同步完成了SGLang与vLLM两大主流推理框架的Day 0适配,确保开发者可在开源首日即时投入生产级部署。小米集团副总裁屈恒此前在小米投资者日活动中透露,MiMo-V2.5系列"适配国内外多家主流推理芯片,其中几乎覆盖所有国产推理芯片"。

MiMo Orbit计划:百万亿Token激励与Agent生态共建
为降低开发者使用门槛并快速扩大生态,小米同步推出MiMo Orbit计划,包含两大组件:
1.百万亿Token创造者激励计划:面向全球AI用户,于北京时间2026年4月28日00:00至5月28日00:00的30天内,发放总计100万亿(100T)免费Token权益,赠完即止。该计划采取申请制,通过审核的用户最高可获得Max档位的Token Plan,包含16亿Credits,官方标注价值659元。申请通道为100t.xiaomimimo.com。
2.Agent生态共建计划:面向全球Agent框架团队,提供限时免费模型接入服务及Token限免支持。目前已与OpenCode、Hermes Agent、KiloCode等框架厂商展开深度合作,同时参与和赞助框架平台的AI Hackathon等共创活动。

结语
从2025年12月开源MiMo-V2-Flash,到2026年3月发布V2系列,再到4月V2.5-Pro登顶全球开源榜首,小米在大模型领域的迭代速度处于行业前列。此次MiMo-V2.5系列开源,不仅意味着小米成为首个登顶全球开源榜首的手机厂商,更通过Day 0级国产芯片全线适配,展现了开源模型从"参数竞赛"向"产业落地"的转向。在OpenRouter平台,中国模型总调用量已连续五周超过美国,占比达61%。随着小米、DeepSeek等国产开源模型在Agent能力与推理效率上的持续突破,中国AI开源生态正从追赶阶段进入领跑阶段。
