Xiaomi MiMo：小米开源的开源大模型，专注于推理能力

发布时间：2025-10-30 10:06 作者： AIer 748 浏览 1 评论

小米在2025年4月底开源了其首个推理大模型 Xiaomi MiMo，它以其 “以小博大” 的特点引起了广泛关注。虽然参数规模不大，但在多项权威测试中超越了参数规模更大的知名模型。

维度	详细说明
核心定位	专注于推理能力的开源大模型
发布公司	小米
开源时间	2025年4月30日
参数规模	7B (70亿参数)
核心功能	数学推理、代码生成
技术亮点	预训练与后训练联动机制、Test Difficulty Driven Reward (TDDR) 算法
突出成绩	在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）测评中，性能超过了OpenAI的o1-mini及阿里通义千问的QwQ-32B-Preview模型

Xiaomi MiMo 的核心能力体现在其深度推理上，这得益于其在数据和算法上的组合创新：

高质量的预训练数据：模型在训练阶段累计使用了25万亿tokens（25T tokens） 的数据。更为关键的是，其中有大约2000亿tokens（200B tokens） 是专门为推理任务合成的数据，这让模型在初期就“见过”更多的推理模式。
创新的后训练算法：在后训练（特别是强化学习阶段），小米团队引入了 Test Difficulty Driven Reward (TDDR) 机制。这个机制会将测试用例按难度分组，并根据难度为模型分配奖励，以此缓解困难算法问题中的奖励稀疏问题，引导模型更好地攻克难题。同时，采用的 Easy Data Re-Sampling 策略也有助于稳定训练过程。

尽管参数规模不大，但Xiaomi MiMo在多项权威基准测试中表现出色，实现了“小参数，大能力”的目标：

这一成绩使其在特定任务上的表现超越了参数规模更大的对手，例如OpenAI的闭源推理模型o1-mini和阿里通义千问320亿参数的QwQ-32B-Preview模型。

Xiaomi MiMo的发布也体现了小米在AI领域的整体战略布局：

专注端侧，轻量化部署：与许多厂商追求庞大的参数规模不同，小米大模型主攻轻量化和本地部署。小米创始人雷军曾表示，将大模型能力下放到设备端侧，能更好地保护用户隐私，并有机会在本地实现千人千面的个性化定制。Xiaomi MiMo正是这一思路的实践，其低功耗和低延迟的特性使其能够适配手机等移动设备。
赋能自身硬件生态：小米致力于将大模型与自身业务深度协同。目前，MiMo的推理能力已逐步接入手机、汽车、AIoT、机器人等业务板块，通过端侧赋能加速智能体验。例如，有资料显示，MiMo已深度嵌入小米HyperOS系统服务层，用户可通过“思维模式”实现离线数学解题、代码片段生成等功能。
坚定的研发投入：小米在AI领域的投入巨大。据报道，2025年小米将投入70亿元以上资金用于AI研发，约占总研发经费的四分之一。同时，小米也搭建了自己的GPU万卡集群，为大规模模型研发提供算力保障。