Llama-1B-GRPO_Final開源模型 - 免費部署用於小學數學問題推理評估

首頁

Llama 1B GRPO Final

由NickyNicky開發

GSM8K 是一個包含8.5K個高質量小學數學問題的數據集，用於評估模型的數學推理能力。

問答系統

Transformers

#數學推理 #教育解題 #多步計算

下載量 437

發布時間 : 1/27/2025

模型概述

GSM8K 數據集由OpenAI發佈，包含8,500個高質量的小學數學問題，旨在評估模型解決數學問題的能力。這些問題需要多步推理才能解決，適合測試模型的數學推理和問題解決能力。

模型特點

高質量數學問題

包含8,500個高質量的小學數學問題，涵蓋多種數學概念和難度級別。

多步推理

每個問題需要多步推理才能解決，適合評估模型的複雜推理能力。

人工驗證

所有問題均由人工編寫和驗證，確保問題的準確性和多樣性。

模型能力

數學問題解決

多步推理

數學概念理解

使用案例

教育

數學輔導

用於開發數學輔導工具，幫助學生理解和解決數學問題。

提升學生的數學推理和問題解決能力。

模型評估

用於評估和比較不同模型在數學問題解決上的性能。

幫助研究人員瞭解模型的數學推理能力。

屬性	詳情
數據集	openai/gsm8k
步驟數量	132

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llama 1B GRPO Final

模型概述

模型特點

模型能力

使用案例

🚀 Transformers項目

🚀 快速開始