Coder-GRPO-3B開源多語言文本生成模型 - 支持13種語言訓練速度翻倍

Coder GRPO 3B

由yasserrmd開發

基於Qwen2.5-3B-Instruct微調的多語言文本生成模型，支持13種語言，訓練速度提升2倍

下載量 1,768

發布時間 : 2/8/2025

模型概述

這是一個基於Qwen2.5-3B-Instruct微調的多語言文本生成模型，專注於代碼輔助任務，採用了Unsloth和TRL庫進行高效訓練

高效訓練

使用Unsloth和TRL庫進行訓練，訓練速度提升2倍

多語言支持

支持13種語言的文本生成

代碼輔助優化

針對代碼輔助任務進行了專門優化

文本生成

多語言處理

代碼輔助

編程輔助

代碼生成

根據自然語言描述生成代碼片段

代碼解釋

解釋現有代碼的功能

多語言應用

多語言文本生成

用13種支持的語言生成文本

屬性	詳情
基礎模型	Qwen/Qwen2.5 - 3B - Instruct
標籤	text - generation - inference、transformers、unsloth、llama、trl
許可證	apache - 2.0
支持語言	中文、英語、法語、西班牙語、葡萄牙語、德語、意大利語、俄語、日語、韓語、越南語、泰語、阿拉伯語
訓練數據集	glaiveai/glaive - code - assistant