小米重磅開源！7B參數(shù)MiMo大模型實力超越OpenAI o1 – mini

William — Wed, 30 Apr 2025 16:31:02 +0000

小米通過“Xiaomi MiMo”公眾號宣布，正式開源其首個“為推理而生”大模型——Xiaomi MiMo。該模型在數(shù)學推理和代碼競賽公開測評集中展現(xiàn)出卓越性能，以僅7B的參數(shù)規(guī)模，成功超越OpenAI的閉源推理模o1-mini，以及阿里Qwen更大規(guī)模開源推理模型QwQ-32B-Preview。

MiMo由新成立的“小米大模型Core團隊”開發(fā)，旨在通過整合預訓練與后訓練技術，全面提升模型的推理能力。官方表示，MiMo的出色表現(xiàn)得益于多方面的創(chuàng)新，包括數(shù)據(jù)處理和算法優(yōu)化。在預訓練階段，團隊著重挖掘豐富的推理語料，并合成了約200B tokens的推理數(shù)據(jù)，通過三階段訓練策略，逐步提升訓練難度，總訓練量達到25T tokens。?

后訓練階段則采用了高效穩(wěn)定的強化學習算法，團隊提出Test Difficulty Driven Reward策略，有效解決了獎勵稀疏問題，并引入Easy Data Re – Sampling策略，進一步穩(wěn)定RL訓練。此外，團隊設計的Seamless Rollout系統(tǒng)使RL訓練速度提升了2.29倍，驗證速度提升1.96倍。?

在實際應用中，MiMo在數(shù)學推理（AIME 24 – 25）和代碼競賽（LiveCodeBench v5）公開測評集中的表現(xiàn)尤為突出，展現(xiàn)了其強大的推理能力。這不僅為研究人員和開發(fā)者提供了新的工具，也預示著小米在AI領域的技術實力正不斷增強。?

小米此次開源Xiaomi MiMo，將進一步推動行業(yè)技術的發(fā)展，為AI領域注入新的活力。感興趣的開發(fā)者可通過HuggingFace獲取開源代碼，技術報告也可在GitHub上查閱。

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請注明出處」

国产精品久久久久久亚洲按摩蜜桃,宅男噜噜噜66网站在线观看,在线理论三级午夜电影

小米重磅開源！7B參數(shù)MiMo大模型實力超越OpenAI o1 – mini

小米重磅開源！7B參數(shù)MiMo大模型實力超越OpenAI o1 – mini