Qwen2.5 0.5B Instruct Gensyn Swarm Peaceful Exotic Butterfly
Gensyn/Qwen2.5-0.5B-Instructをベースにしたファインチューニング版で、TRLフレームワークとGRPOアルゴリズムでトレーニングされ、指示追従タスクに適しています。
Downloads 16
Release Time : 4/2/2025
Model Overview
これは指示理解と生成タスクに特化したファインチューニングされた言語モデルで、強化学習を用いた集団トレーニング手法を採用しています。
Model Features
GRPOアルゴリズムトレーニング
DeepSeekMath論文で提案されたGRPOメソッドを使用してモデル性能を最適化
TRLフレームワーク
Transformerベースの強化学習フレームワークを使用してトレーニング
指示ファインチューニング
指示理解と生成タスク向けに特別に最適化
Model Capabilities
テキスト生成
指示理解
対話生成
Use Cases
対話システム
仮定質問回答
タイムマシン選択問題などのユーザーの仮定質問に回答
論理的で合理的な回答を生成可能
教育応用
思考啓発
学生の思考を広げ、オープンエンドな質問に回答
多様な視点と思考角度を提供
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98