Qwen2.5-1.5B-Instruct開源模型 - 支持本地微調的指令學習好幫手

Qwen2.5 1.5B Instruct

由Gensyn開發

專為Gensyn RL Swarm設計的1.5B參數指令微調模型，支持通過點對點強化學習進行本地微調

下載量 2.1M

發布時間 : 4/4/2025

模型概述

基於Qwen2.5架構的指令微調語言模型，適用於文本生成任務，特別為分佈式強化學習訓練優化

分佈式強化學習優化

專為Gensyn RL Swarm系統設計，支持點對點強化學習微調

高效架構設計

採用RoPE、SwiGLU激活函數和RMSNorm等先進技術

長上下文支持

完整支持32,768令牌上下文，生成支持8,192令牌

分組查詢注意力

使用12查詢頭和2鍵值頭的GQA架構，提高推理效率

文本生成

指令跟隨

聊天對話

分佈式AI訓練

RL Swarm訓練節點

作為分佈式強化學習網絡的參與節點進行模型微調

對話系統

智能聊天助手

部署為對話式AI，理解並回應用戶指令

屬性	詳情
模型類型	因果語言模型
訓練階段	預訓練和後訓練
架構	帶有旋轉位置編碼（RoPE）、SwiGLU激活函數、RMS歸一化（RMSNorm）、注意力QKV偏置和綁定詞嵌入的Transformer架構
參數數量	15.4億
非嵌入參數數量	13.1億
層數	28
注意力頭數量（分組查詢注意力GQA）	查詢（Q）為12，鍵值（KV）為2
上下文長度	完整32768個標記，生成8192個標記