math-shepherd-mistral-7b-rl開源模型 - 免費部署，高效求解各類數學問題

首頁

Math Shepherd Mistral 7b Rl

由peiyi9979開發

基於Math-Shepherd逐步強化學習的數學問題求解模型，在GSM8K和MATH數據集上表現優異

大型語言模型

Transformers

#數學推理強化 #逐步解答生成 #自生成題庫優化

下載量 44

發布時間 : 1/3/2024

模型概述

該模型通過逐步強化學習訓練，專門用於解決數學問題，能夠生成帶步驟標記的詳細解答

模型特點

逐步強化學習

採用Math-Shepherd方法進行逐步強化學習訓練，提高數學推理能力

高通過率

在GSM8K和MATH數據集上分別達到84.1%和33.0%的單次通過率

結構化輸出

生成帶特殊步驟標記的逐步解答，便於解析和理解推理過程

模型能力

數學問題求解

逐步推理

數值計算

應用題解答

使用案例

教育

數學輔導

幫助學生理解數學問題的解決過程

提供詳細的步驟解釋

自動評分

評估學生數學解答的正確性

通過逐步分析判斷解題過程

研究

數學推理研究

研究大型語言模型的數學推理能力

在標準數據集上提供基準性能

數據集	Pass@1 準確率
GSM8K	84.1
MATH	33.0

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Math Shepherd Mistral 7b Rl

模型概述

模型特點

模型能力

使用案例

🚀 Mistral-7b-MetaMATH

🚀 快速開始

模型信息

準確率指標

輸入格式

輸出格式

引用信息