O

Openr1 Qwen 7B SFT Instruct

由 InfiniAILab 开发
基于Qwen2.5-7B-Instruct模型在OpenR1-Math-220k数据集上进行微调的版本,专注于数学相关任务。
下载量 396
发布时间 : 3/8/2025

模型简介

该模型是在Qwen2.5-7B-Instruct基础上,通过SFT(监督微调)方法在数学数据集上进一步训练得到的,旨在提升数学相关任务的性能。

模型特点

数学能力增强
在OpenR1-Math-220k数据集上微调,提升了数学相关任务的性能
指令跟随
继承了基础模型的指令理解与执行能力
高效训练
使用TRL框架进行监督微调,训练效率高

模型能力

数学问题解答
指令理解与执行
文本生成

使用案例

教育
数学问题解答
解答各类数学问题,包括代数、几何等
基于数学数据集微调,预期在数学任务上有更好表现
通用AI助手
指令执行
理解并执行用户的各种指令
继承基础模型的指令跟随能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase