DeepSeek发布在即,小米Mimo-V2.5系列开启公测,罗福莉带队
.cn报道
4月23日,小米Mimo研究所发文宣布,小米
MiMo-V2.5-Pro及MiMo-V2.5模型开启公测,并即将开源
,还有语音合成和语音识别系列紧随其后。

MiMo-V2.5系列,四款模型同时亮相。
带队的人还是
罗福莉
。

如果你关注AI圈,应该知道这个名字。她是
前DeepSeek-V2核心研发成员
,业内人称"天才少女"。
有意思的是,就在小米发模型的这个当口,业界盛传
DeepSeek V4
将于本周发布
。
一个前DeepSeek核心成员,带着新东家在最敏感的时间点亮剑了
。
一、MiMo-V2.5模型定位
专为Agent场景打造
先搞清楚小米这次发了什么。
MiMo-V2.5系列不擅长写朋友圈文案。它的定位极其明确,
专为Agent场景打造
。
MiMo-V2.5-Pro
,小米迄今最强模型,专攻长难Agent任务。在
SWE-bench Pro
(软件工程)、Claw-Eval(智能体评估)、τ3-Bench(长程推理)等基准上,直接对标Claude Opus 4.6和GPT-5.4。

它能稳定完成单次
近千轮工具调用
的长程任务,在超长周期内保持逻辑一致。
MiMo-V2.5
标准版,原生全模态Agent,覆盖图像、音频、视频,平均推理速度比Pro版更快(100-150 tokens/s),适合办公、数据分析等时延敏感场景。

当然了,光说参数没感觉,看三个官方实测:
北大编译原理课程项目
:
用Rust从零实现完整SysY编译器,包括词法分析、语法分析、IR生成、RISC-V后端、性能优化。北大本科生通常做数周,MiMo-V2.5-Pro
4.3小时
、672次工具调用,隐藏测试满分。

视频编辑器Web应用
:
多轨道时间线、片段裁剪、交叉淡化、音频混合、导出流程。代码量8192行,
11.5小时
自主完成,1868次工具调用。

模拟电路EDA设计
:
基于台积电180nm工艺设计FVF-LDO稳压器,连接ngspice仿真闭环迭代,约一小时生成满足全部指标的设计,部分指标比初始版本提升一个数量级。

这些任务的核心特征在于:
它们重在独立完成项目,绝非简单回答问题。
至于网红问题,50米洗车该走路还是开车,
小米的新模型是这么说的:

二、小米选择的突破口
Agent时代的效率优先级
OpenAI强在通用能力和品牌护城河,DeepSeek强在极致性能和开源生态。小米凭什么插一脚?
凭的是
Token效率
。

在Agent基准ClawEval上,MiMo-V2.5-Pro拿到相同分数的情况下,比Kimi本周发布的K2.6
省了
42% Token
;MiMo-V2.5比Meta的Muse Spark
省了
50% Token
。
别小看这个数字。Agent任务绝非一问一答,往往涉及几百上千轮的工具调用、代码执行、错误诊断、自我修正。
Token消耗是指数级增长的,
省42%
意味着同样的预算,任务完成率大幅提升
。

在ClawEval的散点图上,MiMo-V2.5系列牢牢占据
左上角最优区域
,即通过率高且Token消耗低。
而DeepSeek V3.2位于右下角,通过率低且Token消耗极高。
技术路线已经出现分化
。
省钱本身就是一种技术壁垒
。
三、DeepSeek前核心成员
罗福莉带队
罗福莉不是普通研究员。在DeepSeek期间,她是V2模型的核心研发成员。DeepSeek-V2去年以极致性价比震动行业,罗福莉是背后关键推手之一。

加盟小米后,她只花了
36天
就把MiMo从V2迭代到V2.5,性能从接近一线拉到对标顶尖。
更戏剧性的是,今年3月,MiMo-V2-Pro曾以"
Hunter Alpha
"的匿名身份上线OpenRouter平台,被大量开发者
误认为是即将发布的DeepSeek V4
。

一个小米的模型,被当成DeepSeek的下一代旗舰,这说明什么?说明
在硬核开发者眼里,罗福莉出品,天然带有DeepSeek级别的技术预期。
当OpenAI靠Altman的品牌、DeepSeek靠梁文锋的极客文化吸引顶尖人才时,小米靠的是
罗福莉这样的技术IP
。
她不仅带来算法能力,更带来一套已经被验证过的高效训练+极致推理的方法论。
四、Mimo模型的竞争力
人车家生态同步
OpenAI没有手机,DeepSeek没有汽车,Kimi没有IoT生态。
小米有
6亿+月活设备
,有SU7,有
澎湃OS
,有从手环到电视的全场景入口。
现在谁家里没有一两件印着小米Logo的东西呢?

你的手机Agent自动整理相册并剪辑旅行视频;你的车机Agent根据实时路况和电量规划跨省路线;你的家庭Agent协调空调、灯光、扫地机器人完成"回家模式"。
这类任务超出了ChatGPT的能力边界,
因为它们需要理解物理世界、调用硬件工具、在端侧高效运行
。
小米自己做基座模型,目标绝非在榜单上打败OpenAI,
核心诉求在于不让自己的生态命脉掌握在第三方手里
。
当Agent成为下一代交互方式时,没有自研模型的大厂,才是真正的"组装厂"。
五、DeepSeek V4前夜发布
说到这儿,必须回到那个最敏感的话题:
DeepSeek V4
。
业内传闻,DeepSeek V4将于本周发布。而小米选择在这个时间点发布V2.5,很难说是巧合。
罗福莉从DeepSeek到小米,带走的东西远超某段代码本身,
核心是对
Scaling Law
和Agent架构的深度理解
。

当DeepSeek V4本周真的发布时,行业会再次为性能数字沸腾。
但不要忘了,就在它发布的前夜,一个硬件大厂已经证明:
AI竞争的下半场,核心看点已从谁更聪明,转向谁更能落地
。
而
落地,恰恰是小米最熟悉的主场。
