M

Math Shepherd Mistral 7b Prm

peiyi9979によって開発
Mistral-7Bをファインチューニングしたプロセス報酬モデルで、数学問題解答ステップの正しさを評価する
ダウンロード数 3,536
リリース時間 : 1/3/2024

モデル概要

このモデルはMath-Shepherdプロジェクトの一部で、数学問題解答プロセスの各ステップを評価するために特別に設計されており、特殊マーカーでステップを識別し、論理値で正しさを判断する。

モデル特徴

ステップレベル評価
特殊マーカー'ки'で解答ステップを識別し、各数学推論ステップを独立して評価
高精度判断
正しいステップと誤ったステップで大きく異なる信頼度スコアを出力(例:0.9983 vs 0.0240)
軽量ファインチューニング
高性能なMistral-7Bモデルを基に特定タスクに適応させるようファインチューニングし、元モデルの利点を保持

モデル能力

数学ステップ正しさ判断
複数ステップ問題分解評価
数値計算検証
論理推論検証

使用事例

教育テクノロジー
自動採点
学生の数学課題について最終答えだけでなく解答プロセスを自動評価
具体的な誤りステップを識別し、的を絞ったフィードバックを提供
インテリジェントチューターシステム
オンライン学習プラットフォームで解答ステップの正しさをリアルタイム検証
学生が誤りの根源を理解し、解答方法を改善するのを支援
学術研究
数学推論研究
大規模言語モデルの数学推論における典型的な誤りパターンを分析
モデルの数学能力改善に向けたデータサポートを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase