burtenshaw_GemmaCoder3-12B-GGUF開源代碼生成模型，多量化適配不同硬件！

首頁

Burtenshaw GemmaCoder3 12B GGUF

由bartowski開發

基於burtenshaw/GemmaCoder3-12B的量化版本，專為代碼生成任務優化，支持多種量化級別以適應不同硬件需求。

大型語言模型 #代碼生成優化 #競賽編程專用 #低資源量化

下載量 9,066

發布時間 : 4/1/2025

模型概述

這是一個經過監督微調(SFT)的代碼生成模型，基於GemmaCoder3-12B架構，使用Codeforces競賽編程數據集進行訓練。

模型特點

多種量化選項

提供從BF16到IQ2_S共20種量化版本，適應不同硬件配置和性能需求

imatrix優化

使用llama.cpp的imatrix選項進行量化，提高量化後模型的準確性

代碼生成優化

針對Codeforces編程競賽數據進行了監督微調，擅長解決算法問題

模型能力

代碼生成

算法問題解決

編程競賽問題解答

使用案例

編程教育

算法學習輔助

幫助學生理解和解決編程競賽中的算法問題

提供高質量的代碼解決方案

開發者工具

代碼自動補全

為開發者提供代碼建議和補全功能

提高編程效率

🚀 GemmaCoder3-12B的Llamacpp imatrix量化版本

本項目是對burtenshaw的GemmaCoder3-12B模型進行的Llamacpp imatrix量化。它使用特定的量化工具和數據集，生成了多種不同類型的量化模型，可在不同的硬件環境下運行，為用戶提供了更多的選擇。

🚀 快速開始

使用 llama.cpp 版本 b5010 進行量化。原始模型地址：https://huggingface.co/burtenshaw/GemmaCoder3-12B 所有量化模型均使用imatrix選項和來自這裡的數據集生成。你可以在 LM Studio 中運行這些量化模型，也可以直接使用 llama.cpp 或任何基於llama.cpp的項目運行。

✨ 主要特性

多種量化類型：提供了豐富的量化類型，如bf16、Q8_0、Q6_K_L等，滿足不同的性能和質量需求。
特定權重處理：部分量化模型（如Q3_K_XL、Q4_K_L等）將嵌入和輸出權重量化為Q8_0，而不是默認值，以提高性能。
在線重打包：支持Q4_0的在線重打包功能，可根據硬件自動優化性能。

📦 安裝指南

安裝huggingface-cli

首先，確保你已經安裝了huggingface-cli：

pip install -U "huggingface_hub[cli]"

下載特定文件

你可以指定要下載的特定文件：

huggingface-cli download bartowski/burtenshaw_GemmaCoder3-12B-GGUF --include "burtenshaw_GemmaCoder3-12B-Q4_K_M.gguf" --local-dir ./

下載拆分文件

如果模型大於50GB，它將被拆分為多個文件。要將它們全部下載到本地文件夾，請運行：

huggingface-cli download bartowski/burtenshaw_GemmaCoder3-12B-GGUF --include "burtenshaw_GemmaCoder3-12B-Q8_0/*" --local-dir ./

你可以指定一個新的本地目錄（如burtenshaw_GemmaCoder3-12B-Q8_0），也可以將它們全部下載到當前目錄（./）。

💻 使用示例

基礎用法

以下是使用huggingface-cli下載特定文件的示例：

# 下載特定文件
huggingface-cli download bartowski/burtenshaw_GemmaCoder3-12B-GGUF --include "burtenshaw_GemmaCoder3-12B-Q4_K_M.gguf" --local-dir ./

高級用法

如果你需要下載拆分的文件，可以使用以下命令：

# 下載拆分的文件
huggingface-cli download bartowski/burtenshaw_GemmaCoder3-12B-GGUF --include "burtenshaw_GemmaCoder3-12B-Q8_0/*" --local-dir ./

📚 詳細文檔

提示格式

<bos><start_of_turn>user
{system_prompt}

{prompt}<end_of_turn>
<start_of_turn>model
<end_of_turn>
<start_of_turn>model

下載文件列表

文件名	量化類型	文件大小	拆分情況	描述
GemmaCoder3-12B-bf16.gguf	bf16	23.54GB	false	完整的BF16權重。
GemmaCoder3-12B-Q8_0.gguf	Q8_0	12.51GB	false	極高質量，通常不需要，但為最大可用量化。
GemmaCoder3-12B-Q6_K_L.gguf	Q6_K_L	9.90GB	false	將嵌入和輸出權重量化為Q8_0。非常高質量，接近完美，推薦。
GemmaCoder3-12B-Q5_K_L.gguf	Q5_K_L	8.69GB	false	將嵌入和輸出權重量化為Q8_0。高質量，推薦。
GemmaCoder3-12B-Q5_K_M.gguf	Q5_K_M	8.45GB	false	高質量，推薦。
GemmaCoder3-12B-Q4_1.gguf	Q4_1	7.56GB	false	舊格式，性能與Q4_K_S相似，但在Apple硅芯片上的每瓦令牌數有所提高。
GemmaCoder3-12B-Q4_K_L.gguf	Q4_K_L	7.54GB	false	將嵌入和輸出權重量化為Q8_0。質量良好，推薦。
GemmaCoder3-12B-Q4_K_M.gguf	Q4_K_M	7.30GB	false	質量良好，大多數用例的默認大小，推薦。
GemmaCoder3-12B-Q4_K_S.gguf	Q4_K_S	6.94GB	false	質量稍低，但節省更多空間，推薦。
GemmaCoder3-12B-Q4_0.gguf	Q4_0	6.91GB	false	舊格式，可為ARM和AVX CPU推理提供在線重打包。
GemmaCoder3-12B-IQ4_NL.gguf	IQ4_NL	6.89GB	false	類似於IQ4_XS，但稍大。可為ARM CPU推理提供在線重打包。
GemmaCoder3-12B-Q3_K_XL.gguf	Q3_K_XL	6.72GB	false	將嵌入和輸出權重量化為Q8_0。質量較低但可用，適合低內存情況。
GemmaCoder3-12B-IQ4_XS.gguf	IQ4_XS	6.55GB	false	質量尚可，比Q4_K_S小，性能相似，推薦。
GemmaCoder3-12B-Q3_K_L.gguf	Q3_K_L	6.48GB	false	質量較低但可用，適合低內存情況。
GemmaCoder3-12B-Q3_K_M.gguf	Q3_K_M	6.01GB	false	低質量。
GemmaCoder3-12B-IQ3_M.gguf	IQ3_M	5.66GB	false	中低質量，新方法，性能與Q3_K_M相當。
GemmaCoder3-12B-Q3_K_S.gguf	Q3_K_S	5.46GB	false	低質量，不推薦。
GemmaCoder3-12B-IQ3_XS.gguf	IQ3_XS	5.21GB	false	質量較低，新方法，性能尚可，略優於Q3_K_S。
GemmaCoder3-12B-Q2_K_L.gguf	Q2_K_L	5.01GB	false	將嵌入和輸出權重量化為Q8_0。質量非常低，但出人意料地可用。
GemmaCoder3-12B-IQ3_XXS.gguf	IQ3_XXS	4.78GB	false	質量較低，新方法，性能尚可，與Q3量化相當。
GemmaCoder3-12B-Q2_K.gguf	Q2_K	4.77GB	false	質量非常低，但出人意料地可用。
GemmaCoder3-12B-IQ2_M.gguf	IQ2_M	4.31GB	false	質量相對較低，使用SOTA技術，出人意料地可用。
GemmaCoder3-12B-IQ2_S.gguf	IQ2_S	4.02GB	false	質量較低，使用SOTA技術，可用。