QVQ-72B-Preview-GGUFオープンソースモデル - ローカルデプロイと推論をサポートし、簡単に便利に使用できます。

QVQ 72B Preview GGUF

tensorblockによって開発

QVQ-72B-PreviewのGGUF量子化バージョンで、ローカルデプロイと推論に適しています。

ダウンロード数 220

リリース時間 : 12/26/2024

モデル概要

これは72Bパラメータ規模の大規模言語モデルで、GGUF形式で量子化されており、ローカル環境で効率的に実行できます。

複数の量子化オプション

Q2_KからQ8_0までの複数の量子化レベルを提供し、さまざまなシナリオのニーズを満たします。

ローカルでの効率的な実行

GGUF形式はローカル推論性能を最適化し、ハードウェア要件を軽減します。

llama.cppとの互換性

最新版のllama.cppと互換性があり、既存のワークフローに簡単に統合できます。

テキスト生成

対話システム

コンテンツ作成

コード生成

コンテンツ作成

記事執筆

高品質の長編記事を生成します。

対話システム

スマートアシスタント

知識豊富な対話AIを構築します。

このリポジトリには、Qwen/QVQ-72B-Preview のGGUF形式のモデルファイルが含まれています。これらのファイルは TensorBlock が提供するマシンを使用して量子化されており、コミット b4391 までのバージョンの llama.cpp と互換性があります。

まず、Huggingfaceクライアントをインストールします。

pip install -U "huggingface_hub[cli]"

次に、単一のモデルファイルをローカルディレクトリにダウンロードします。

huggingface-cli download tensorblock/QVQ-72B-Preview-GGUF --include "QVQ-72B-Preview-Q2_K.gguf" --local-dir MY_LOCAL_DIR

パターン（例：*Q4_K*gguf）で複数のモデルファイルをダウンロードする場合は、以下のコマンドを試してください。

huggingface-cli download tensorblock/QVQ-72B-Preview-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

プロジェクト名	プロジェクト詳細
Awesome MCP Servers	包括的なモデルコンテキストプロトコル（MCP）サーバーの集合です。 👉 プロジェクトを見る 👈
TensorBlock Studio	軽量で、オープンかつ拡張可能な多大言語モデルインタラクションスタジオです。 👉 プロジェクトを見る 👈

プロジェクトA	プロジェクトB

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

ファイル名	量子化タイプ	ファイルサイズ	説明
QVQ-72B-Preview-Q2_K.gguf	Q2_K	29.812 GB	最小ですが、品質の損失が著しく、ほとんどのシナリオでは推奨されません。
QVQ-72B-Preview-Q3_K_S.gguf	Q3_K_S	34.488 GB	非常に小さいですが、品質の損失が高いです。
QVQ-72B-Preview-Q3_K_M.gguf	Q3_K_M	37.699 GB	非常に小さいですが、品質の損失が高いです。
QVQ-72B-Preview-Q3_K_L.gguf	Q3_K_L	39.505 GB	小さいですが、品質の損失が比較的大きいです。
QVQ-72B-Preview-Q4_0.gguf	Q4_0	41.232 GB	旧バージョンです；小さいですが、品質の損失が非常に高く、Q3_K_M の使用を推奨します。
QVQ-72B-Preview-Q4_K_S.gguf	Q4_K_S	43.889 GB	小さいですが、品質の損失がさらに大きいです。
QVQ-72B-Preview-Q4_K_M.gguf	Q4_K_M	47.416 GB	中程度で、品質がバランスしており、推奨されます。
QVQ-72B-Preview-Q5_0	Q5_0	50.164 GB	旧バージョンです；中程度で、品質がバランスしており、Q4_K_M の使用を推奨します。
QVQ-72B-Preview-Q5_K_S	Q5_K_S	51.375 GB	大きいですが、品質の損失が低く、推奨されます。
QVQ-72B-Preview-Q5_K_M	Q5_K_M	54.447 GB	大きいですが、品質の損失が非常に低く、推奨されます。
QVQ-72B-Preview-Q6_K	Q6_K	64.348 GB	非常に大きく、品質の損失が極低いです。
QVQ-72B-Preview-Q8_0	Q8_0	77.263 GB	非常に大きく、品質の損失が極低いですが、使用は推奨されません。