OpenR1-Qwen-7B-SFT-Instruct開源模型 - 專注數學任務，免費助力數學問題解決

首頁

Openr1 Qwen 7B SFT Instruct

由InfiniAILab開發

基於Qwen2.5-7B-Instruct模型在OpenR1-Math-220k數據集上進行微調的版本，專注於數學相關任務。

大型語言模型

Transformers

#數學推理微調 #指令精調 #Qwen2.5優化

下載量 396

發布時間 : 3/8/2025

模型概述

該模型是在Qwen2.5-7B-Instruct基礎上，通過SFT（監督微調）方法在數學數據集上進一步訓練得到的，旨在提升數學相關任務的性能。

模型特點

數學能力增強

在OpenR1-Math-220k數據集上微調，提升了數學相關任務的性能

指令跟隨

繼承了基礎模型的指令理解與執行能力

高效訓練

使用TRL框架進行監督微調，訓練效率高

模型能力

數學問題解答

指令理解與執行

文本生成

使用案例

教育

數學問題解答

解答各類數學問題，包括代數、幾何等

基於數學數據集微調，預期在數學任務上有更好表現

通用AI助手

指令執行

理解並執行用戶的各種指令

繼承基礎模型的指令跟隨能力

屬性	詳情
基礎模型	Qwen/Qwen2.5-7B-Instruct
訓練數據集	open-r1/OpenR1-Math-220k
庫名稱	transformers
模型名稱	OpenR1-Qwen-7B-SFT-Instruct
標籤	generated_from_trainer、open-r1、trl、sft

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Openr1 Qwen 7B SFT Instruct

模型概述

模型特點

模型能力

使用案例

🚀 OpenR1-Qwen-7B-SFT-Instruct

🚀 快速開始

🔧 技術細節

訓練過程

框架版本

📄 許可證

📚 引用

模型信息表格