幼米跟了DeepSeek价值战!直降99%,全面对标
智器材作者|江宇编纂|李水青
DeepSeek刚颁发API永远降价,幼米也跟了。
智器材5月27日,今日,幼米正式颁发MiMo-V2.5系列API价值永远下调,并同步升级新版Token Plan计费系统。相比原始定价,新价值最高降幅达到99%,且不再分辨高低文窗口长度。
▲MiMo-V2.5系列API价值永远下调(图源:幼米)
▲幼米MiMo新版Token Plan计费系统:定价不变/Credits大幅提升(图源:幼米)
就在几天前,DeepSeek刚刚颁发:从6月1日起,DeepSeek-V4-Pro当前促销价将直接转为正式价值,不再恢复原价。此前,DeepSeek已将V4-Pro API价值降至2.5折,并把输入缓存射中价值进一步压到原价1/10。
短短一周内,两家国产大模型厂商先后选择“永远降价”,国内API价值战再次升温。
而这一次,幼米MiMo险些直接对标了DeepSeek当前API的价值。更新后的价值表显示,更新后的价值显示,MiMo-V2.5输入缓存射中价值已经降至0.02元/百万tokens,未射中输入为1元/百万tokens,输出价值为2元/百万tokens;MiMo-V2.5-Pro则别离为0.025元、3元和6元。
▲DeepSeek与幼米MiMo API价值对比表(智器材造表)
值妥贴心的是,MiMo这次还取缔了此前按高低文长度分辨价值的战术。无论是256K还是1M高低文窗口,均统一选取统一价值。
昨日,我们深度梳理并对比过国内表数十家主流大模型厂商的订阅造套餐与API挪用计费。
其中,DeepSeek选择“永远降价”,阿里则暂停了Coding Plan中的Lite廉价套餐,字节下架廉价Coding Plan,智谱2026年一季度API挪用定价提升83%。不齐全统计,近半年至少已有幼米、字节、阿里、智谱和腾讯等5家国产大模型厂商,对自家套餐系统进行过显著调整。部门厂商起头缩减廉价套餐、削减额度,整体价值有所上涨。
有意思的是,就在不久前,幼米MiMo大模型掌管人罗福莉还曾公开“开怼”行业价值战。但另一壁,幼米MiMo又靠着“100万亿Token免费打算”,一度冲上Hermes全球挪用量第一。
▲罗福莉在X上的发文部门截图(图源:X)
如今,幼米MiMo也正式参与了这场持久价值战。
一、Token Plan大改版:套餐容量提升5-8倍
除了API永远降价,这次变动最大的,其实是Token Plan套餐系统。
幼米称,新版计费规定进行了沉新梳理,在价值不变的情况下,套餐Credits大幅提升,用量普遍达到原来的5-8倍。
从我们梳理的国内主流大模型订阅造套餐来看,幼米这次调整后,入门档方面,幼米Lite套餐与Kimi、字节、阶跃星辰等厂商的最低档位靠近,但并不是市场最低,腾讯混元Hy目前仍有28元/月的Lite档。
而高阶档方面,幼米Max套餐也并非最高。目前阿里尊享版达到1398元/月,字节Agent Plan Max档位为950元/月,MiniMax Ultra极速版则靠近750元/月。
▲国内大模型订阅造套餐价值对比(智器材造表,统计截止功夫为:2026/05/27)
与此同时,幼米还颁布了新版Credits与Token换算关系,并公开给出了高缓存射中场景下,分歧套餐大体对应的现实Token规模。
▲幼米MiMo Credits与Token换算关系
依照幼米给出的95%以上缓存射中场景测算,若是使用MiMo-V2.5,39元Lite套餐理论上已经能够跑到5亿Token以上,99元Standard档位超过13亿Token,329元Pro档位达到47亿Token以上,659元Max档位则突破100亿Token。
即就是更贵的MiMo-V2.5-Pro,在高缓存射中场景下,39元Lite档位也能达到1.9亿Token以上,99元套餐超过5亿Token,329元档位约18亿Token,659元Max档位则靠近40亿Token。
幼米出格强调,在Agent与Code类场景下,由于缓存射中率通常更高,现实可使用Token数量会显著增长。
幼米“百万亿Token创造者激励打算”也一度引发开发者圈关注。幼米披露,截至5月26日下午4点08分,100T Tokens已经全数提前发放结束,活动提前收官。所有当前仍在有效期内的Token Plan用户,无论此前套餐已经使用到什么水平,其Credits额度都将在5月27日0点全数沉置,并自动切换至新计费规定。
针对已经过期的汗青付用度户,幼米后续也将提供额表福利。
二、幼米为什么敢降价?推理系统上的持续优化
这次幼米也专门诠氏缢背后的推理优化规划。
幼米团队基于SGLang HiCache齐全支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储间的数据搬运量降低至优化前的约1/7,可缓存Token数量提升至约5倍。与此同时,幼米还优化了专家并行规划、输入长度分桶战术等机造,进一步提升集群输入吞吐能力,从而降低单元Token成本。
单一来说,幼米这次的主题逻辑其实和DeepSeek类似:一壁是更激进的缓存射中战术,一壁是更高的推理吞吐效能。
价值战背后,性质依然是推理系统与基础设施能力的竞争。
三、模型能力进入前排后,幼米MiMo补上价值牌
今年4月23日,幼米正式开启Xiaomi MiMo-V2.5系列大模型公测,推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个版本。其中,MiMo-V2.5-Pro沉点面向Agent、复杂软件工程以及长程工作等场景。
目前,MiMo-V2.5-Pro在Artificial Analysis综合智能榜中位列全球开源模型并列第一,同时进入全球大模型总榜前五;其Agent指数同样位列全球开源模型并列第一。
4月28日,幼米进一步将MiMo-V2.5系列以MIT和谈正式开源,支持商用部署与二次训练,无需额表授权。
而真正让MiMo在开发者圈急剧出圈的,还是此前那轮“100万亿Token免费打算”。
5月9日,Hermes Agent(“爱马仕”)初次超过OpenClaw(“龙虾”),登顶OpenRouter全球利用挪用量榜首。其时,Hermes月挪用量排名前五的模型中,MiMo-V2-Pro排在第一,后面顺次是MiniMax M2.7、英伟达Nemotron 3 Super、阶跃星辰Step 3.5 Flash以及腾讯Hy3 preview。
不外,榜单变动也非?。
截至5月27日上午9点,OpenRouter本周挪用榜中,MiMo-V2.5-Pro位列第十四;
▲OpenRouter本周挪用榜(截至5月27日上午9点)
在Hermes Agent模型月挪用榜里,MiMo-V2-Pro也已从此前榜首掉到第16名。
▲(图源:OpenRouter)
目前排名前三的别离是DeepSeek-V4-Flash、匿名模型Owl Alpha以及DeepSeek-V4-Pro。
▲(图源:OpenRouter)
某种水平上,这也能看出当前国内大模型竞争的强烈水平:一壁是榜单和挪用量变动越来越快,另一壁,则是价值战起头直接挨近DeepSeek的“地板价”。
结语:营收利润双降后,幼米还是下场打起了价值战
价值战之表,幼米昨日的财报,也让这轮降价多了一层“大放血”的意味。一季度,幼米营收991亿元,同比降落10.9%;经调整净利润61亿元,同比降落43.1%。
另一壁,幼米对AI的投入并没有放缓。财报显示,其当季研发开支达到90亿元,同比增长33.4%;截至2026年3月31日,幼米研发人员数量达到26048人,创下汗青新高。
幼米治理层也在财报会上频仍提到AI。当被问到雷军此前提出的160亿元AI投资打算时,幼米集团CFO林世伟以为未来对于AI的投资打算会凭据AI业务的发展情况进行调整,预期会有所上涨。
卢伟冰则专门提到,在当前内存上涨周期里,“抓住AI极度沉要”。
从MiMo开源、100万亿Token免费打算,到冲击OpenRouter Agent榜单,再到如今直接跟进DeepSeek永远降价,幼米从前一个多月在AI上的作为显著频仍。而随着国内模型价值持续下探,这场竞争也已经不只是模型能力自身的比拼,背后更是一场萦绕推理系统、算力效能以及持久资金投入的持续亏损战。
文章点评
未查问到任何数据!
颁发评论
◎欢迎参加会商,请在这里颁发您的见解、互换您的概想。