gemma-3-12b-it-codeforces-SFT開源大語言模型 - 基於特定數據集微調實用高效

首頁

Gemma 3 12b It Codeforces SFT

由qgallouedec開發

基於google/gemma-3-12b-it在codeforces-cots數據集上微調的大語言模型

大型語言模型

Transformers

#編程競賽微調 #大語言模型 #代碼生成

下載量 43

發布時間 : 3/14/2025

模型概述

該模型是google/gemma-3-12b-it的微調版本，專門針對編程競賽問題解決進行了優化，使用TRL框架進行監督式微調。

模型特點

編程競賽優化

在codeforces-cots數據集上微調，特別適合解決編程競賽問題

監督式微調

使用TRL框架進行監督式微調(SFT)，提升模型性能

大模型能力

基於12B參數的Gemma模型，具備強大的理解和生成能力

模型能力

代碼生成

編程問題解答

算法解釋

文本生成

使用案例

編程教育

編程競賽訓練

幫助學生理解和解決編程競賽題目

提高算法理解和編碼能力

代碼生成輔助

根據問題描述自動生成解決方案代碼

加速開發過程

技術面試準備

算法問題解答

模擬技術面試中的算法問題解答

幫助面試者準備技術面試

屬性	詳情
基礎模型	google/gemma-3-12b-it
訓練數據集	open-r1/codeforces-cots
庫名稱	transformers
模型名稱	gemma-3-12b-it-codeforces-SFT
標籤	generated_from_trainer、trl、sft
許可證	license

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Gemma 3 12b It Codeforces SFT

模型概述

模型特點

模型能力

使用案例

🚀 gemma-3-12b-it-codeforces-SFT

🚀 快速開始

代碼示例

📦 模型信息

🔧 訓練過程

框架版本

📄 引用信息