O

Openr1 Qwen 7B SFT Instruct

由InfiniAILab開發
基於Qwen2.5-7B-Instruct模型在OpenR1-Math-220k數據集上進行微調的版本,專注於數學相關任務。
下載量 396
發布時間 : 3/8/2025

模型概述

該模型是在Qwen2.5-7B-Instruct基礎上,通過SFT(監督微調)方法在數學數據集上進一步訓練得到的,旨在提升數學相關任務的性能。

模型特點

數學能力增強
在OpenR1-Math-220k數據集上微調,提升了數學相關任務的性能
指令跟隨
繼承了基礎模型的指令理解與執行能力
高效訓練
使用TRL框架進行監督微調,訓練效率高

模型能力

數學問題解答
指令理解與執行
文本生成

使用案例

教育
數學問題解答
解答各類數學問題,包括代數、幾何等
基於數學數據集微調,預期在數學任務上有更好表現
通用AI助手
指令執行
理解並執行用戶的各種指令
繼承基礎模型的指令跟隨能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase