Qwen2.5-Coder-1.5B-Instruct-abliterated-GGUF開源模型

首頁

Qwen2.5 Coder 1.5B Instruct Abliterated GGUF

由bartowski開發

基於Qwen2.5-Coder-1.5B-Instruct-abliterated模型的Llamacpp imatrix量化版本，適用於代碼生成和文本生成任務。

大型語言模型英語開源協議:Apache-2.0 #代碼生成優化 #無審查對話 #多級量化適配

下載量 729

發布時間 : 11/13/2024

模型概述

這是一個經過量化的1.5B參數代碼生成模型，基於Qwen2.5架構，支持無限制文本生成和聊天功能。

模型特點

多種量化選項

提供從F16到IQ2_M等多種量化版本，適應不同硬件需求

無限制生成

支持去審查的無限制文本生成

ARM優化

提供專門為ARM芯片優化的量化版本

imatrix量化

使用llama.cpp的imatrix選項進行量化，提高量化質量

模型能力

文本生成

代碼生成

聊天對話

無限制內容生成

使用案例

編程輔助

代碼補全

幫助開發者完成代碼片段的編寫

內容創作

無限制文本生成

生成各種類型的無審查限制文本內容

🚀 Qwen2.5-Coder-1.5B-Instruct-abliterated的Llamacpp imatrix量化模型

本項目提供了基於llama.cpp對Qwen2.5-Coder-1.5B-Instruct-abliterated模型進行量化的版本。通過量化，能夠在不同硬件條件下更高效地運行模型，滿足多樣化的使用需求。

🚀 快速開始

模型量化

使用 llama.cpp 版本 b4058 進行量化。原始模型可從這裡獲取。所有量化版本均使用imatrix選項，並採用該數據集進行校準。

運行環境

你可以在 LM Studio 中運行這些量化模型。

提示詞格式

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

📦 安裝指南

安裝huggingface-cli

首先，確保你已經安裝了huggingface-cli：

pip install -U "huggingface_hub[cli]"

下載指定文件

你可以指定要下載的具體文件：

huggingface-cli download bartowski/Qwen2.5-Coder-1.5B-Instruct-abliterated-GGUF --include "Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_M.gguf" --local-dir ./

下載分割文件

如果模型大小超過50GB，它會被分割成多個文件。要將它們全部下載到本地文件夾，請運行：

huggingface-cli download bartowski/Qwen2.5-Coder-1.5B-Instruct-abliterated-GGUF --include "Qwen2.5-Coder-1.5B-Instruct-abliterated-Q8_0/*" --local-dir ./

你可以指定一個新的本地目錄（如Qwen2.5-Coder-1.5B-Instruct-abliterated-Q8_0），或者直接下載到當前目錄（./）。

📚 詳細文檔

下載文件列表

文件名	量化類型	文件大小	分割情況	描述
Qwen2.5-Coder-1.5B-Instruct-abliterated-f16.gguf	f16	3.56GB	否	完整的F16權重。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q8_0.gguf	Q8_0	1.89GB	否	極高質量，通常不需要，但為最大可用量化。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q6_K_L.gguf	Q6_K_L	1.58GB	否	嵌入和輸出權重使用Q8_0。非常高質量，接近完美，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q6_K.gguf	Q6_K	1.46GB	否	非常高質量，接近完美，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q5_K_L.gguf	Q5_K_L	1.43GB	否	嵌入和輸出權重使用Q8_0。高質量，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q5_K_M.gguf	Q5_K_M	1.29GB	否	高質量，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_L.gguf	Q4_K_L	1.29GB	否	嵌入和輸出權重使用Q8_0。質量良好，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q5_K_S.gguf	Q5_K_S	1.26GB	否	高質量，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_XL.gguf	Q3_K_XL	1.18GB	否	嵌入和輸出權重使用Q8_0。質量較低但可用，適合低內存情況。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_M.gguf	Q4_K_M	1.12GB	否	質量良好，大多數使用場景的默認大小，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_S.gguf	Q4_K_S	1.07GB	否	質量略低，但節省空間，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0_8_8.gguf	Q4_0_8_8	1.07GB	否	針對ARM推理進行優化。需要'sve'支持（見下面的鏈接）。不要在Mac或Windows上使用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0_4_8.gguf	Q4_0_4_8	1.07GB	否	針對ARM推理進行優化。需要'i8mm'支持（見下面的鏈接）。不要在Mac或Windows上使用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0_4_4.gguf	Q4_0_4_4	1.07GB	否	針對ARM推理進行優化。應該在所有ARM芯片上都能良好工作，如果你不確定，可以選擇這個。不要在Mac或Windows上使用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0.gguf	Q4_0	1.07GB	否	舊格式，通常不如類似大小的其他格式值得使用
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ4_XS.gguf	IQ4_XS	1.02GB	否	質量不錯，比Q4_K_S更小，性能相似，推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_L.gguf	Q3_K_L	0.98GB	否	質量較低但可用，適合低內存情況。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q2_K_L.gguf	Q2_K_L	0.98GB	否	嵌入和輸出權重使用Q8_0。質量非常低，但出人意料地可用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_M.gguf	Q3_K_M	0.92GB	否	質量低。
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ3_M.gguf	IQ3_M	0.88GB	否	中低質量，新方法，性能與Q3_K_M相當。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_S.gguf	Q3_K_S	0.86GB	否	質量低，不推薦。
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ3_XS.gguf	IQ3_XS	0.83GB	否	質量較低，新方法，性能不錯，比Q3_K_S略好。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q2_K.gguf	Q2_K	0.75GB	否	質量非常低，但出人意料地可用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ2_M.gguf	IQ2_M	0.70GB	否	質量相對較低，使用了最先進的技術，出人意料地可用。