Qwen1.5-MoE-A2.7B-GGUFオープンソースモデル - 通义千问1.5版は複数の量子化形式をサポートしています

Qwen1.5 MoE A2.7B GGUF

tensorblockによって開発

通義千問1.5バージョンのハイブリッドエキスパート（MoE）モデルで、パラメータ規模は27億で、複数の量子化バージョンのGGUF形式ファイルを提供します。

ダウンロード数 163

リリース時間 : 11/11/2024

モデル概要

これはQwen1.5アーキテクチャに基づくハイブリッドエキスパートモデルで、複数の量子化バージョンのGGUF形式ファイルを提供し、ローカル推論シナリオに適しています。

複数の量子化オプション

Q2_KからQ8_0まで、合計12種類の異なる量子化レベルのモデルファイルを提供し、さまざまなシナリオのニーズを満たします。

効率的な推論

ハイブリッドエキスパートアーキテクチャは、モデルの性能を維持しながら推論効率を向上させます。

llama.cpp互換性

すべてのモデルファイルはllama.cppと互換性があり、ローカルデプロイと使用が容易です。

中国語テキスト生成

対話システム

テキスト理解

対話システム

スマートカスタマーサービス

オンラインカスタマーサービスシステムとしてデプロイし、ユーザーの質問に回答します。

コンテンツ作成

テキスト生成

記事や物語などのコンテンツの作成を支援します。

このリポジトリには、Qwen/Qwen1.5-MoE-A2.7B のGGUF形式のモデルファイルが含まれています。これらのファイルは、TensorBlock が提供するマシンを使用して量子化されており、コミットb4011 以降のllama.cppと互換性があります。

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

ファイル名	量子化タイプ	ファイルサイズ	説明
Qwen1.5-MoE-A2.7B-Q2_K.gguf	Q2_K	5.486 GB	最も小さいが、品質が大幅に低下する - ほとんどの用途では推奨されない
Qwen1.5-MoE-A2.7B-Q3_K_S.gguf	Q3_K_S	6.372 GB	非常に小さいが、品質が大きく低下する
Qwen1.5-MoE-A2.7B-Q3_K_M.gguf	Q3_K_M	6.927 GB	非常に小さいが、品質が大きく低下する
Qwen1.5-MoE-A2.7B-Q3_K_L.gguf	Q3_K_L	7.212 GB	小さいが、品質が大幅に低下する
Qwen1.5-MoE-A2.7B-Q4_0.gguf	Q4_0	7.590 GB	旧型式; 小さいが、品質が非常に大きく低下する - Q3_K_Mを使用することを推奨
Qwen1.5-MoE-A2.7B-Q4_K_S.gguf	Q4_K_S	8.110 GB	小さいが、品質が大きく低下する
Qwen1.5-MoE-A2.7B-Q4_K_M.gguf	Q4_K_M	8.844 GB	中程度で、品質がバランスが取れている - 推奨
Qwen1.5-MoE-A2.7B-Q5_0.gguf	Q5_0	9.220 GB	旧型式; 中程度で、品質がバランスが取れている - Q4_K_Mを使用することを推奨
Qwen1.5-MoE-A2.7B-Q5_K_S.gguf	Q5_K_S	9.462 GB	大きいが、品質の低下が少ない - 推奨
Qwen1.5-MoE-A2.7B-Q5_K_M.gguf	Q5_K_M	10.090 GB	大きいが、品質の低下が非常に少ない - 推奨
Qwen1.5-MoE-A2.7B-Q6_K.gguf	Q6_K	11.889 GB	非常に大きいが、品質の低下が極めて少ない
Qwen1.5-MoE-A2.7B-Q8_0.gguf	Q8_0	14.180 GB	非常に大きいが、品質の低下が極めて少ない - 推奨されない

まず、Huggingface Clientをインストールします。

pip install -U "huggingface_hub[cli]"

次に、個々のモデルファイルをローカルディレクトリにダウンロードします。

huggingface-cli download tensorblock/Qwen1.5-MoE-A2.7B-GGUF --include "Qwen1.5-MoE-A2.7B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

パターンを指定して複数のモデルファイルをダウンロードする場合は（例: *Q4_K*gguf）、以下のコマンドを試してください。

huggingface-cli download tensorblock/Qwen1.5-MoE-A2.7B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

Forge

OpenAI互換のマルチプロバイダルーティングレイヤーです。
🚀 今すぐ試す！ 🚀
Awesome MCP Servers	TensorBlock Studio

Model Context Protocol (MCP)サーバーの包括的なコレクションです。	軽量で、オープンかつ拡張可能なマルチLLMインタラクションスタジオです。
👀 私たちが構築したものを見る 👀	👀 私たちが構築したものを見る 👀