Q

Qwen2.5 0.5B Instruct Gensyn Swarm Peaceful Exotic Butterfly

由juliannode開發
基於Gensyn/Qwen2.5-0.5B-Instruct的微調版本,採用TRL框架和GRPO算法訓練,適用於指令跟隨任務。
下載量 16
發布時間 : 4/2/2025

模型概述

這是一個經過微調的語言模型,專注於指令理解和生成任務,採用了強化學習群體訓練方法。

模型特點

GRPO算法訓練
採用DeepSeekMath論文中提出的GRPO方法進行訓練,優化模型性能
TRL框架
使用基於Transformer的強化學習框架進行訓練
指令微調
針對指令理解和生成任務進行了專門優化

模型能力

文本生成
指令理解
對話生成

使用案例

對話系統
假設性問題回答
回答用戶提出的假設性問題,如時光機選擇問題
能生成合理且有邏輯的回答
教育應用
思維啟發
幫助學生拓展思維,回答開放式問題
提供多樣化的觀點和思考角度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase