M

Mimo 7B SFT

XiaomiMiMoによって開発
MiMo-7B-RLはMiMo-7B-SFTモデルを基に強化学習でトレーニングされたモデルで、数学とコード推論タスクにおいてOpenAI o1-miniと肩を並べる性能を発揮します。
ダウンロード数 1,183
リリース時間 : 4/29/2025

モデル概要

推論タスクに最適化された7Bパラメータの言語モデルで、強化学習トレーニングにより数学とコード推論能力が大幅に向上

モデル特徴

強化学習による最適化
入念に設計されたRLトレーニングプロセスにより、数学とコード推論能力が大幅に向上
マルチトークン予測
MTP技術を補助トレーニング目標として採用し、性能向上と推論加速を両立
効率的な推論
最適化されたモデルは高性能を維持しながら、より高速な推論を実現

モデル能力

数学問題解決
コード生成と補完
論理的推論
テキスト理解と生成
複雑な問題解答

使用事例

教育
数学問題解答
学生が抱える様々な数学問題を解答、高等数学競技問題も含む
AIME数学競技問題で68.2%の正解率を達成
プログラミング支援
コード生成
自然言語の記述から実行可能なコードを生成
LiveCodeBenchテストで57.8%の正解率を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase