Qwen2.5-0.5B-Instruct開源模型 - 支持本地微調訓練，為Gensyn強化學習群量身打造

Qwen2.5 0.5B Instruct

由Gensyn開發

專為Gensyn強化學習群設計的0.5B參數指令微調模型，支持本地微調訓練

下載量 2.4M

發布時間 : 3/28/2025

模型概述

基於Qwen2.5-0.5B的指令微調模型，專為點對點強化學習設計，可用於各類文本生成任務

強化學習優化

專為Gensyn強化學習群設計，支持通過點對點強化學習進行本地微調訓練

高效架構

採用RoPE、SwiGLU、RMSNorm等高效組件，提升模型性能

長上下文支持

支持完整32,768 tokens上下文長度，生成8192 tokens

文本生成

指令理解

聊天對話

強化學習

本地微調訓練

在Gensyn強化學習群中進行點對點強化學習微調

通用文本生成

聊天應用

用於構建聊天機器人等對話系統

屬性	詳情
模型類型	因果語言模型
訓練階段	預訓練與後訓練
架構	帶有 RoPE、SwiGLU、RMSNorm、注意力 QKV 偏置和綁定詞嵌入的 Transformer 架構
參數數量	0.49B
參數數量（非嵌入）	0.36B
層數	24
注意力頭數量（GQA）	Q 為 14，KV 為 2
上下文長度	完整 32,768 個標記，生成 8192 個標記