M

Mimo 7B Base

Developed by XiaomiMiMo
小米推出的7B參數規模推理專用語言模型系列,通過優化預訓練和後訓練策略顯著提升數學與代碼推理能力
Downloads 12.75k
Release Time : 4/29/2025

Model Overview

專為推理任務設計的語言模型系列,包含基礎模型、SFT模型和RL訓練模型,在數學和代碼推理任務上表現優異

Model Features

推理優化預訓練
通過數據過濾和合成數據增強預訓練數據中的推理模式密度
多token預測
採用MTP作為輔助訓練目標,提升模型性能並加速推理
強化學習優化
針對數學和編程題設計專門的RL訓練策略,包括難度感知獎勵機制
高效推理架構
優化後的推理引擎實現2.29倍訓練加速和1.96倍驗證加速

Model Capabilities

數學問題求解
編程代碼生成
複雜推理任務
多輪對話
知識問答

Use Cases

教育
數學題解答
解答高中及以上難度的數學問題
在MATH-500測試集上達到95.8%準確率
編程教學輔助
生成和解釋編程代碼
在LiveCodeBench測試集上表現優異
科研
科學問題推理
處理需要多步推理的科學問題
在GPQA鑽石題測試中表現良好
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase