QwQ-32B-GGUFオープンソースモデル - ローカルでの無料デプロイと推論に適した実用的なツール

ホーム

Qwq 32B GGUF

tensorblockによって開発

QwQ-32BのGGUFフォーマット量子化バージョン、ローカル展開と推論に適しています

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #32B大規模パラメータモデル #GGUF量子化フォーマット #マルチターン対話最適化

ダウンロード数 1,312

リリース時間 : 3/5/2025

モデル概要

このリポジトリにはQwen/QwQ-32BのGGUFフォーマットモデルファイルが含まれており、TensorBlock提供のマシンで量子化され、llama.cppと互換性があります。

モデル特徴

マルチ量子化バージョン

Q2_KからQ8_0までの12種類の量子化バージョンを提供し、さまざまなハードウェアと性能要件に対応します

llama.cpp互換

b4823コミットバージョンまでのllama.cppと互換性があり、ローカル展開が容易です

チャット最適化

専用のプロンプトテンプレートを提供し、チャットインタラクション体験を最適化します

モデル能力

テキスト生成

対話インタラクション

使用事例

対話システム

インテリジェントチャットアシスタント

ローカルチャットボットを展開

コンテンツ生成

テキスト創作

様々なテキストコンテンツを生成

🚀 Qwen/QwQ-32B - GGUF

このリポジトリには、Qwen/QwQ-32B のGGUF形式のモデルファイルが含まれています。これらのファイルは、TensorBlock が提供するマシンを使用して量子化されており、コミット b4823 以降のllama.cppと互換性があります。

フィードバックとサポート: TensorBlockの Twitter/X、Telegramグループ、Discordサーバー

✨ 主な機能

Awesome MCP Servers	TensorBlock Studio

モデルコンテキストプロトコル（MCP）サーバーの包括的なコレクション。	軽量でオープンかつ拡張可能なマルチLLMインタラクションスタジオ。
👀 私たちが構築したものを見る 👀	👀 私たちが構築したものを見る 👀

📚 ドキュメント

プロンプトテンプレート

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant
<think>

モデルファイル仕様

ファイル名	量子化タイプ	ファイルサイズ	説明
QwQ-32B-Q2_K.gguf	Q2_K	12.313 GB	最も小さいが、品質が大幅に低下する - ほとんどの用途では推奨されない
QwQ-32B-Q3_K_S.gguf	Q3_K_S	14.392 GB	非常に小さいが、品質が大きく低下する
QwQ-32B-Q3_K_M.gguf	Q3_K_M	15.935 GB	非常に小さいが、品質が大きく低下する
QwQ-32B-Q3_K_L.gguf	Q3_K_L	17.247 GB	小さいが、品質が大幅に低下する
QwQ-32B-Q4_0.gguf	Q4_0	18.640 GB	旧型式; 小さいが、品質が非常に大きく低下する - Q3_K_Mの使用を推奨
QwQ-32B-Q4_K_S.gguf	Q4_K_S	18.784 GB	小さいが、品質が大きく低下する
QwQ-32B-Q4_K_M.gguf	Q4_K_M	19.851 GB	中程度で、品質がバランスが取れている - 推奨
QwQ-32B-Q5_0.gguf	Q5_0	22.638 GB	旧型式; 中程度で、品質がバランスが取れている - Q4_K_Mの使用を推奨
QwQ-32B-Q5_K_S.gguf	Q5_K_S	22.638 GB	大きいが、品質の低下が少ない - 推奨
QwQ-32B-Q5_K_M.gguf	Q5_K_M	23.262 GB	大きいが、品質の低下が非常に少ない - 推奨
QwQ-32B-Q6_K.gguf	Q6_K	26.886 GB	非常に大きいが、品質の低下が極めて少ない
QwQ-32B-Q8_0.gguf	Q8_0	34.821 GB	非常に大きいが、品質の低下が極めて少ない - 推奨されない

📦 インストール

コマンドライン

まず、Huggingface Clientをインストールします。

pip install -U "huggingface_hub[cli]"

次に、個々のモデルファイルをローカルディレクトリにダウンロードします。

huggingface-cli download tensorblock/QwQ-32B-GGUF --include "QwQ-32B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

パターン（例：*Q4_K*gguf）で複数のモデルファイルをダウンロードしたい場合は、以下のコマンドを試してください。

huggingface-cli download tensorblock/QwQ-32B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

📄 ライセンス

このプロジェクトは Apache-2.0 ライセンスの下で公開されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご