math-shepherd-mistral-7b-rlオープンソースモデル - 無料でデプロイ可能、様々な数学問題を効率的に解決

ホーム

Math Shepherd Mistral 7b Rl

peiyi9979によって開発

Math-Shepherdの段階的強化学習に基づく数学問題解決モデルで、GSM8KとMATHデータセットで優れた性能を発揮

大規模言語モデル

Transformers

#数学推論強化 #段階的解答生成 #自動作成問題集最適化

ダウンロード数 44

リリース時間 : 1/3/2024

モデル概要

このモデルは段階的強化学習で訓練され、数学問題を解決するために特別に設計されており、ステップマーカー付きの詳細な解答を生成可能

モデル特徴

段階的強化学習

Math-Shepherd手法を用いた段階的強化学習訓練により、数学推論能力を向上

高合格率

GSM8KとMATHデータセットでそれぞれ84.1%と33.0%の単一試行合格率を達成

構造化出力

特殊ステップマーカー付きの段階的解答を生成し、解析と推論過程の理解を容易に

モデル能力

数学問題解決

段階的推論

数値計算

応用問題解答

使用事例

教育

数学指導

学生が数学問題の解決過程を理解するのを支援

詳細なステップ解説を提供

自動採点

学生の数学解答の正しさを評価

段階的分析による解答過程の判断

研究

数学推論研究

大規模言語モデルの数学推論能力を研究

標準データセットでのベンチマーク性能を提供

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Math Shepherd Mistral 7b Rl

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Mistral-7b-MetaMATH

🚀 クイックスタート

ベースモデル

PRM

PPO学習セット

Pass@1

入力形式

出力形式

引用文献