M

Mimo 7B Base

由XiaomiMiMo開發
小米推出的7B參數規模推理專用語言模型系列,通過優化預訓練和後訓練策略顯著提升數學與代碼推理能力
下載量 12.75k
發布時間 : 4/29/2025

模型概述

專為推理任務設計的語言模型系列,包含基礎模型、SFT模型和RL訓練模型,在數學和代碼推理任務上表現優異

模型特點

推理優化預訓練
通過數據過濾和合成數據增強預訓練數據中的推理模式密度
多token預測
採用MTP作為輔助訓練目標,提升模型性能並加速推理
強化學習優化
針對數學和編程題設計專門的RL訓練策略,包括難度感知獎勵機制
高效推理架構
優化後的推理引擎實現2.29倍訓練加速和1.96倍驗證加速

模型能力

數學問題求解
編程代碼生成
複雜推理任務
多輪對話
知識問答

使用案例

教育
數學題解答
解答高中及以上難度的數學問題
在MATH-500測試集上達到95.8%準確率
編程教學輔助
生成和解釋編程代碼
在LiveCodeBench測試集上表現優異
科研
科學問題推理
處理需要多步推理的科學問題
在GPQA鑽石題測試中表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase