Qwen2.5 - 1.5B - Instructオープンソースモデル - ローカルファインチューニングをサポートする命令学習の良いヘルパー

Qwen2.5 1.5B Instruct

Gensynによって開発

Gensyn RL Swarm専用に設計された15億パラメータの命令微調整モデルで、ピアツーピア強化学習によるローカル微調整をサポート

ダウンロード数 2.1M

リリース時間 : 4/4/2025

モデル概要

Qwen2.5アーキテクチャに基づく命令微調整言語モデルで、テキスト生成タスクに適しており、分散型強化学習トレーニングに最適化

分散型強化学習最適化

Gensyn RL Swarmシステム専用設計で、ピアツーピア強化学習微調整をサポート

効率的なアーキテクチャ設計

RoPE、SwiGLU活性化関数やRMSNormなどの先進技術を採用

長文脈サポート

32,768トークンの文脈を完全サポート、生成は8,192トークンをサポート

グループ化クエリアテンション

12クエリヘッドと2キーバリューヘッドのGQAアーキテクチャを使用し、推論効率を向上

テキスト生成

命令追従

チャット対話

分散型AIトレーニング

RL Swarmトレーニングノード

分散型強化学習ネットワークの参加ノードとしてモデル微調整を実施

対話システム

インテリジェントチャットアシスタント

対話型AIとして展開し、ユーザーの命令を理解して応答

属性	详情
モデルタイプ	因果言語モデル
学習段階	事前学習と事後学習
アーキテクチャ	RoPE、SwiGLU、RMSNorm、Attention QKVバイアス、および結合語彙埋め込みを備えたTransformers
パラメータ数	15.4億
パラメータ数 (非埋め込み)	13.1億
レイヤー数	28
アテンションヘッド数 (GQA)	Qに12、KVに2
コンテキスト長	最大32,768トークン、生成時8192トークン