小米開(kāi)源首個(gè)推理大模型Xiaomi MiMo
田寧
2025-04-30 11:46
4月30日消息,小米開(kāi)源首個(gè)為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。
在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開(kāi)源推理模型QwQ-32B-Preview。

圖源:Xiaomi MiMo公眾號(hào)
隨著DeepSeek-R1引發(fā)業(yè)界強(qiáng)化學(xué)習(xí)(RL)共創(chuàng)潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成為廣泛使用的強(qiáng)化學(xué)習(xí)起步模型。在相同RL訓(xùn)練數(shù)據(jù)情況下,MiMo-7B的數(shù)學(xué)&代碼領(lǐng)域的強(qiáng)化學(xué)習(xí)潛力顯著領(lǐng)先。

圖源:Xiaomi MiMo公眾號(hào)
值得注意的是,MiMo-7B全系列模型均已開(kāi)源。據(jù)了解,MiMo來(lái)自小米全新成立不久的“小米大模型Core團(tuán)隊(duì)”的初步嘗試。
聲明
1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商派觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn

田寧
電商脈搏,媒體前沿洞察。