Qwen2.5-0.5B-Instruct开源模型 - 支持本地微调训练，为Gensyn强化学习群量身打造

Qwen2.5 0.5B Instruct

由 Gensyn 开发

专为Gensyn强化学习群设计的0.5B参数指令微调模型，支持本地微调训练

下载量 2.4M

发布时间 : 3/28/2025

模型简介

基于Qwen2.5-0.5B的指令微调模型，专为点对点强化学习设计，可用于各类文本生成任务

强化学习优化

专为Gensyn强化学习群设计，支持通过点对点强化学习进行本地微调训练

高效架构

采用RoPE、SwiGLU、RMSNorm等高效组件，提升模型性能

长上下文支持

支持完整32,768 tokens上下文长度，生成8192 tokens

文本生成

指令理解

聊天对话

强化学习

本地微调训练

在Gensyn强化学习群中进行点对点强化学习微调

通用文本生成

聊天应用

用于构建聊天机器人等对话系统

属性	详情
模型类型	因果语言模型
训练阶段	预训练与后训练
架构	带有 RoPE、SwiGLU、RMSNorm、注意力 QKV 偏置和绑定词嵌入的 Transformer 架构
参数数量	0.49B
参数数量（非嵌入）	0.36B
层数	24
注意力头数量（GQA）	Q 为 14，KV 为 2
上下文长度	完整 32,768 个标记，生成 8192 个标记