小米推出三款自研大模型,雷军称今年在AI领域将投入超160亿
3
月
19
日,小米宣布推出三款自研大模型
Xiaomi MiMo-V2-Pro
、
Xiaomi MiMo-V2-Omni
与
Xiaomi MiMo-V2-TTS
。据悉,
MiMo-V2-Pro
、
MiMo-V2-Omni
已正式开放
API
服务。
据小米官方介绍,三款模型中,
MiMo-V2-Pro
是旗舰文本基座,专为高强度
Agent
工作场景而生,主打推理、规划与工具调用。
MiMo-V2-Omni
是全模态
Agent
基座,原生融合文本、视觉与音频感知,打通从理解到执行的完整链路。
MiMo-V2-TTS
是语音合成大模型,目标是为
Agent
赋予有温度、有情感的声音表达能力,构成全栈的最后一环。
MiMo-V2-Pro
作为旗舰基座模型,
专为Agent场景深度优化,针对复杂多样的智能体架构进行了监督微调和强化学习,具备更强工具调用与多步推理能力,
并最终交付结果。从架构上看,该模型
总参
数规模突破
1
万亿(
1T
),其中激活参数为
42B
,采用改进后的混合注意力机制(
Hybrid Attention
),在保证推理效率的同时大幅提升模型容量。其上下文窗口进一步扩展至
100
万
Token
,可以支持超长任务链和复杂工作流。
同步亮相的
MiMo-V2-Omni
与
MiMo-V2-TTS
,则补齐了感知与表达的两块拼图。前者的核心价值在于实现了音频、图像、视频的对齐。后者支持细粒度控制的情感表达引擎,让
Agent
具备了更接近人类的表达能力。
定价方面,
MiMo-V2-Pro
的
API
价格比同级别竞品低
。
256K
上下文以内,输入每百万
tokens
定价
1
美元,输出
3
美元;
1M
上下文范围内,则为输入
2
美元,输出
6
美元。目前,
MiMo-V2-Pro
已正式开放
API
服务。
MiMo-V2-Omni
也已开放
API
,支持
256K
上下文长度,输入定价每百万
tokens 0.4
美元,输出
2
美元。

MiMo-V2-Pro 和Claude的API服务收费标准
此外,小米还联合
OpenClaw
、
OpenCode
、
KiloCode
、
Blackbox
及
Cline
五大
Agent
框架团队,提供为期一周的限时免费接口支持,进一步推动其在开发者社区的渗透。

这也被视为小米全面押注智能体(
Agent
)时代的重要信号。当天一早,小米创始人雷军在社交平台发文称:
“
在
AI
领域,我们今年的研发和资本投入就将超过
160
亿元。
”

据雷军透露,万亿参数大模型
MiMo-V2-Pro
在全球大模型综合智能排行榜
Artificial Analysis
上,位列全球第八。按大模型品牌来排名,排在全球第五。
“
我们模型刚刚完成,未来一段时间,还会快速迭代增强。
”
值得一提的是,小米
MiMo
大模型负责人罗福莉也在社交平台公开表示,此前上线的
“Hunter Alpha”
正是旗舰模型
MiMo-V2-Pro
的内部测试版本。
95
后罗福莉被业界称为“
AI
才女”。
3
月
11
日,代号为
“Hunter Alpha”
的神秘模型上线全球最大
API
聚合平台
OpenRouter
。据悉,短短七天,该模型累计调用量突破
1
万亿
Token
,连续多日登顶榜单,
引起热议,
一度被误认为是
“DeepSeek V4”
的早期版本。。
巧合的是,罗福莉曾在
DeepSeek任职
。她的职业生涯始于阿里达摩院,主导开发了多语言预训练模型
VECO
,并推动了
AliceMind
的开源工作。
2022
年,罗福莉加入
DeepSeek
母公司幻方量化从事深度学习相关工作,后又担任
DeepSeek
的深度学习研究员,参与研发
DeepSeek-V2
等模型。
去年
12
月,在小米“人车家全生态”合作伙伴大会上,罗福莉首次公开亮相。
12
月
17
日,小米集团合伙人、集团总裁卢伟冰宣布小米自研
AI
大模型
Xiaomi MiMo-V2-Flash
正式开源上线。
卢伟冰当时透露,小米已在AI
领域启动“压强式投入”,大模型与应用进展“远超预期”,未来将聚焦“
AI
与物理世界的深度结合”这一核心方向。
