Q

Qwen2.5 0.5B Instruct Gensyn Swarm Peaceful Exotic Butterfly

Developed by juliannode
Gensyn/Qwen2.5-0.5B-Instructをベースにしたファインチューニング版で、TRLフレームワークとGRPOアルゴリズムでトレーニングされ、指示追従タスクに適しています。
Downloads 16
Release Time : 4/2/2025

Model Overview

これは指示理解と生成タスクに特化したファインチューニングされた言語モデルで、強化学習を用いた集団トレーニング手法を採用しています。

Model Features

GRPOアルゴリズムトレーニング
DeepSeekMath論文で提案されたGRPOメソッドを使用してモデル性能を最適化
TRLフレームワーク
Transformerベースの強化学習フレームワークを使用してトレーニング
指示ファインチューニング
指示理解と生成タスク向けに特別に最適化

Model Capabilities

テキスト生成
指示理解
対話生成

Use Cases

対話システム
仮定質問回答
タイムマシン選択問題などのユーザーの仮定質問に回答
論理的で合理的な回答を生成可能
教育応用
思考啓発
学生の思考を広げ、オープンエンドな質問に回答
多様な視点と思考角度を提供
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase