Qwen2.5-1.5B教學獎勵模型開源！為數學教育提供教學輔助與支架式學習

首頁

Qwen2.5 1.5B Pedagogical Rewardmodel

由eth-nlped開發

該模型是基於MathDial和MRBench數據集訓練的獎勵模型，專注於數學教育領域的教學輔助和支架式學習。

大型語言模型

Transformers

#數學教學輔助 #支架式學習 #教育獎勵模型

下載量 5,332

發布時間 : 2/25/2025

模型概述

基於Qwen2.5-1.5B-Instruct微調的獎勵模型，用於評估數學教學對話質量，支持教育應用中的教學輔助和個性化學習。

模型特點

數學教學專業化

針對數學教育場景優化，能有效評估教學對話質量

支架式學習支持

可輔助構建漸進式學習路徑，提供個性化教學反饋

教育領域適應

基於專業教育數據集訓練，理解教學場景的特殊需求

模型能力

教學對話質量評估

教學策略推薦

學習進度分析

個性化反饋生成

使用案例

教育技術

智能教學助手

集成到教育平臺中評估教師AI的對話質量

提升AI教學助手的教學效果和互動質量

自適應學習系統

用於分析學生-教師對話，調整教學難度和節奏

實現更精準的個性化學習路徑規劃

教育研究

教學策略分析

評估不同教學方法的對話效果

為教育研究提供量化評估工具

屬性	詳情
模型類型	獎勵模型
訓練數據	MathDial 和 MRBench 數據集的成對偏好數據
基礎模型	Qwen/Qwen2.5 - 1.5B - Instruct
標籤	獎勵、模型、教育、教學、支架式教學

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Qwen2.5 1.5B Pedagogical Rewardmodel

模型概述

模型特點

模型能力

使用案例

🚀 獎勵模型

🚀 快速開始

📄 許可證

📦 模型信息