Qwen1.5-MoE-A2.7B-GGUF開源模型 - 通義千問1.5版支持多量化格式

首頁

Qwen1.5 MoE A2.7B GGUF

由tensorblock開發

通義千問1.5版本的混合專家(MoE)模型，參數規模為2.7B，提供多種量化版本的GGUF格式文件

大型語言模型英語開源協議:其他 #混合專家模型 #輕量級推理 #多量化選擇

下載量 163

發布時間 : 11/11/2024

模型概述

這是一個基於Qwen1.5架構的混合專家模型，提供多種量化版本的GGUF格式文件，適用於本地推理場景。

模型特點

多種量化選項

提供從Q2_K到Q8_0共12種不同量化級別的模型文件，滿足不同場景需求

高效推理

混合專家架構在保持模型性能的同時提高了推理效率

llama.cpp兼容

所有模型文件與llama.cpp兼容，便於本地部署和使用

模型能力

中文文本生成

對話系統

文本理解

使用案例

對話系統

智能客服

部署為在線客服系統，回答用戶問題

內容創作

文本生成

輔助創作文章、故事等內容

🚀 通義千問/Qwen1.5-MoE-A2.7B - GGUF

本倉庫包含 Qwen/Qwen1.5-MoE-A2.7B 的 GGUF 格式模型文件。這些文件由 TensorBlock 提供的機器進行量化，自提交 b4011 起，它們與 llama.cpp 兼容。

🚀 快速開始

此部分介紹了項目的核心內容，即提供 Qwen/Qwen1.5-MoE-A2.7B 的 GGUF 格式模型文件，以及這些文件的量化來源和兼容性。

✨ 主要特性

提供多種量化類型的模型文件，以滿足不同的使用需求。
模型文件與 llama.cpp 兼容，方便用戶進行使用。

📦 安裝指南

命令行安裝

首先，安裝 Huggingface 客戶端：

pip install -U "huggingface_hub[cli]"

然後，將單個模型文件下載到本地目錄：

huggingface-cli download tensorblock/Qwen1.5-MoE-A2.7B-GGUF --include "Qwen1.5-MoE-A2.7B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式下載多個模型文件（例如，*Q4_K*gguf），可以嘗試：

huggingface-cli download tensorblock/Qwen1.5-MoE-A2.7B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

💻 使用示例

提示模板

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

📚 詳細文檔

模型文件規格

文件名	量化類型	文件大小	描述
Qwen1.5-MoE-A2.7B-Q2_K.gguf	Q2_K	5.486 GB	最小，但質量顯著下降 - 不建議用於大多數場景
Qwen1.5-MoE-A2.7B-Q3_K_S.gguf	Q3_K_S	6.372 GB	非常小，但質量損失較大
Qwen1.5-MoE-A2.7B-Q3_K_M.gguf	Q3_K_M	6.927 GB	非常小，但質量損失較大
Qwen1.5-MoE-A2.7B-Q3_K_L.gguf	Q3_K_L	7.212 GB	小，但質量有較大損失
Qwen1.5-MoE-A2.7B-Q4_0.gguf	Q4_0	7.590 GB	舊版本；小，但質量損失非常大 - 建議使用 Q3_K_M
Qwen1.5-MoE-A2.7B-Q4_K_S.gguf	Q4_K_S	8.110 GB	小，但質量損失更大
Qwen1.5-MoE-A2.7B-Q4_K_M.gguf	Q4_K_M	8.844 GB	中等，質量平衡 - 推薦使用
Qwen1.5-MoE-A2.7B-Q5_0.gguf	Q5_0	9.220 GB	舊版本；中等，質量平衡 - 建議使用 Q4_K_M
Qwen1.5-MoE-A2.7B-Q5_K_S.gguf	Q5_K_S	9.462 GB	大，質量損失小 - 推薦使用
Qwen1.5-MoE-A2.7B-Q5_K_M.gguf	Q5_K_M	10.090 GB	大，質量損失非常小 - 推薦使用
Qwen1.5-MoE-A2.7B-Q6_K.gguf	Q6_K	11.889 GB	非常大，質量損失極低
Qwen1.5-MoE-A2.7B-Q8_0.gguf	Q8_0	14.180 GB	非常大，質量損失極低 - 不建議使用

🔧 技術細節

模型文件由 TensorBlock 提供的機器進行量化，確保了量化的準確性和高效性。並且自提交 b4011 起，與 llama.cpp 兼容，方便用戶在 llama.cpp 環境中使用這些模型文件。

📄 許可證

本項目使用通義千問許可證。

我們的項目

項目名稱	項目描述	項目鏈接
Forge	一個與 OpenAI 兼容的多提供商路由層。	🚀 立即嘗試！🚀
Awesome MCP Servers	一個全面的模型上下文協議（MCP）服務器集合。	👀 查看我們的成果 👀
TensorBlock Studio	一個輕量級、開放且可擴展的多大語言模型交互工作室。	👀 查看我們的成果 👀