DeepSeek发布在即，小米Mimo-V2.5系列开启公测，罗福莉带队

发布时间：2026-04-23来源：鞭牛士

.cn报道

4月23日，小米Mimo研究所发文宣布，小米

MiMo-V2.5-Pro及MiMo-V2.5模型开启公测，并即将开源

，还有语音合成和语音识别系列紧随其后。

MiMo-V2.5系列，四款模型同时亮相。

带队的人还是

罗福莉

。

如果你关注AI圈，应该知道这个名字。她是

前DeepSeek-V2核心研发成员

，业内人称"天才少女"。

有意思的是，就在小米发模型的这个当口，业界盛传

DeepSeek V4

将于本周发布

。

一个前DeepSeek核心成员，带着新东家在最敏感的时间点亮剑了

。

一、MiMo-V2.5模型定位

专为Agent场景打造

先搞清楚小米这次发了什么。

MiMo-V2.5系列不擅长写朋友圈文案。它的定位极其明确，

专为Agent场景打造

。

MiMo-V2.5-Pro

，小米迄今最强模型，专攻长难Agent任务。在

SWE-bench Pro

（软件工程）、Claw-Eval（智能体评估）、τ3-Bench（长程推理）等基准上，直接对标Claude Opus 4.6和GPT-5.4。

它能稳定完成单次

近千轮工具调用

的长程任务，在超长周期内保持逻辑一致。

MiMo-V2.5

标准版，原生全模态Agent，覆盖图像、音频、视频，平均推理速度比Pro版更快（100-150 tokens/s），适合办公、数据分析等时延敏感场景。

当然了，光说参数没感觉，看三个官方实测：

北大编译原理课程项目

：

用Rust从零实现完整SysY编译器，包括词法分析、语法分析、IR生成、RISC-V后端、性能优化。北大本科生通常做数周，MiMo-V2.5-Pro

4.3小时

、672次工具调用，隐藏测试满分。

视频编辑器Web应用

：

多轨道时间线、片段裁剪、交叉淡化、音频混合、导出流程。代码量8192行，

11.5小时

自主完成，1868次工具调用。

模拟电路EDA设计

：

基于台积电180nm工艺设计FVF-LDO稳压器，连接ngspice仿真闭环迭代，约一小时生成满足全部指标的设计，部分指标比初始版本提升一个数量级。

这些任务的核心特征在于：

它们重在独立完成项目，绝非简单回答问题。

至于网红问题，50米洗车该走路还是开车，

小米的新模型是这么说的：

二、小米选择的突破口

Agent时代的效率优先级

OpenAI强在通用能力和品牌护城河，DeepSeek强在极致性能和开源生态。小米凭什么插一脚？

凭的是

Token效率

。

在Agent基准ClawEval上，MiMo-V2.5-Pro拿到相同分数的情况下，比Kimi本周发布的K2.6

省了

42% Token

；MiMo-V2.5比Meta的Muse Spark

省了

50% Token

。

别小看这个数字。Agent任务绝非一问一答，往往涉及几百上千轮的工具调用、代码执行、错误诊断、自我修正。

Token消耗是指数级增长的，

省42%

意味着同样的预算，任务完成率大幅提升

。

在ClawEval的散点图上，MiMo-V2.5系列牢牢占据

左上角最优区域

，即通过率高且Token消耗低。

而DeepSeek V3.2位于右下角，通过率低且Token消耗极高。

技术路线已经出现分化

。

省钱本身就是一种技术壁垒

。

三、DeepSeek前核心成员

罗福莉带队

罗福莉不是普通研究员。在DeepSeek期间，她是V2模型的核心研发成员。DeepSeek-V2去年以极致性价比震动行业，罗福莉是背后关键推手之一。

加盟小米后，她只花了

36天

就把MiMo从V2迭代到V2.5，性能从接近一线拉到对标顶尖。

更戏剧性的是，今年3月，MiMo-V2-Pro曾以"

Hunter Alpha

"的匿名身份上线OpenRouter平台，被大量开发者

误认为是即将发布的DeepSeek V4

。

一个小米的模型，被当成DeepSeek的下一代旗舰，这说明什么？说明

在硬核开发者眼里，罗福莉出品，天然带有DeepSeek级别的技术预期。

当OpenAI靠Altman的品牌、DeepSeek靠梁文锋的极客文化吸引顶尖人才时，小米靠的是

罗福莉这样的技术IP

。

她不仅带来算法能力，更带来一套已经被验证过的高效训练+极致推理的方法论。

四、Mimo模型的竞争力

人车家生态同步

OpenAI没有手机，DeepSeek没有汽车，Kimi没有IoT生态。

小米有

6亿+月活设备

，有SU7，有

澎湃OS

，有从手环到电视的全场景入口。

现在谁家里没有一两件印着小米Logo的东西呢？

你的手机Agent自动整理相册并剪辑旅行视频；你的车机Agent根据实时路况和电量规划跨省路线；你的家庭Agent协调空调、灯光、扫地机器人完成"回家模式"。

这类任务超出了ChatGPT的能力边界，

因为它们需要理解物理世界、调用硬件工具、在端侧高效运行

。

小米自己做基座模型，目标绝非在榜单上打败OpenAI，

核心诉求在于不让自己的生态命脉掌握在第三方手里

。

当Agent成为下一代交互方式时，没有自研模型的大厂，才是真正的"组装厂"。

五、DeepSeek V4前夜发布

说到这儿，必须回到那个最敏感的话题：

DeepSeek V4

。

业内传闻，DeepSeek V4将于本周发布。而小米选择在这个时间点发布V2.5，很难说是巧合。

罗福莉从DeepSeek到小米，带走的东西远超某段代码本身，

核心是对

Scaling Law

和Agent架构的深度理解

。

当DeepSeek V4本周真的发布时，行业会再次为性能数字沸腾。

但不要忘了，就在它发布的前夜，一个硬件大厂已经证明：

AI竞争的下半场，核心看点已从谁更聪明，转向谁更能落地

。

而

落地，恰恰是小米最熟悉的主场。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。