Qwen2-VL-72B-Instruct-GGUFオープンソースモデル - マルチモーダルな画像テキストからテキストへの変換を無料で実現

ホーム

Qwen2 VL 72B Instruct GGUF

second-stateによって開発

Qwen2-VL-72B-InstructのGGUF量子化バージョンで、マルチモーダルの画像テキストからテキストへの変換をサポートし、LlamaEdgeで実行できます。

画像生成テキスト

Transformers

英語オープンソースライセンス:その他 #マルチモーダル視覚理解 #大規模モデルの量子化デプロイ #画像テキスト生成

ダウンロード数 221

リリース時間 : 12/15/2024

モデル概要

これはマルチモーダルモデルで、画像とテキストの入力を処理し、テキスト結果を出力できます。さまざまな量子化バージョンが提供され、さまざまなシナリオのニーズに対応しています。

モデル特徴

マルチモーダルサポート

画像とテキストの入力を同時に処理し、テキスト結果を出力できます。

複数の量子化オプション

2ビットから16ビットまでの複数の量子化バージョンを提供し、さまざまなシナリオのニーズを満たします。

大規模コンテキストサポート

128000のコンテキストサイズをサポートします。

モデル能力

画像理解

テキスト生成

マルチモーダル推論

使用事例

視覚質問応答

画像説明生成

入力画像に基づいて詳細なテキスト説明を生成します。

視覚推論

画像内容に基づいて論理的な推論と質問に対する解答を行います。

マルチモーダルアプリケーション

画像テキスト対話システム

画像とテキストを同時に理解できる対話システムを構築します。

🚀 Qwen2-VL-72B-Instruct-GGUF

このプロジェクトは、Qwen2-VL-72B-InstructモデルのGGUF量子化バージョンを提供しています。LlamaEdgeを使って実行でき、マルチモーダルな画像テキストからテキストへの変換をサポートしています。

🚀 クイックスタート

LlamaEdgeを使ったモデルの実行

LlamaEdgeバージョン：v0.16.0

プロンプトテンプレート

プロンプトタイプ：qwen2-vision

プロンプト文字列

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
<|vision_start|>{image_placeholder}<|vision_end|>{user_prompt}<|im_end|>
<|im_start|>assistant

コンテキストサイズ：128000

LlamaEdgeサービスとして実行する

wasmedge --dir .:. --nn-preload default:GGML:AUTO:Qwen2-VL-72B-Instruct-Q5_K_M.gguf \
  llama-api-server.wasm \
  --model-name Qwen2-VL-72B-Instruct \
  --prompt-template qwen2-vision \
  --llava-mmproj Qwen2-VL-72B-Instruct-vision-encoder.gguf \
  --ctx-size 128000

✨ 主な機能

マルチモーダル対応：このモデルはマルチモーダルモデルで、画像とテキストの入力を処理し、テキスト結果を出力することができます。
複数の量子化オプション：様々なビット数の量子化バージョンを提供しており、必要に応じてモデルのサイズと品質をトレードオフすることができます。

📚 ドキュメント

オリジナルモデル

オリジナルモデルはQwen/Qwen2-VL-72B-Instruct です。

量子化されたGGUFモデル

名称	量子化方法	ビット数	サイズ	使用シーン
Qwen2-VL-72B-Instruct-Q2_K.gguf	Q2_K	2	29.8 GB	最も小さいですが、品質の損失が著しく、ほとんどのシーンでは推奨されません。
Qwen2-VL-72B-Instruct-Q3_K_L.gguf	Q3_K_L	3	39.5 GB	小さいですが、品質の損失が大きいです。
Qwen2-VL-72B-Instruct-Q3_K_M.gguf	Q3_K_M	3	37.7 GB	非常に小さいですが、品質の損失が高いです。
Qwen2-VL-72B-Instruct-Q3_K_S.gguf	Q3_K_S	3	34.5 GB	非常に小さいですが、品質の損失が高いです。
Qwen2-VL-72B-Instruct-Q4_0.gguf	Q4_0	4	41.2 GB	旧バージョン；小さいですが、品質の損失が非常に高く、Q3_K_Mの使用をおすすめします。
Qwen2-VL-72B-Instruct-Q4_K_M.gguf	Q4_K_M	4	47.4 GB	中程度で、品質がバランスしており、推奨されます。
Qwen2-VL-72B-Instruct-Q4_K_S.gguf	Q4_K_S	4	43.9 GB	小さいですが、品質の損失が大きいです。
Qwen2-VL-72B-Instruct-Q5_0-00001-of-00002.gguf	Q5_0	5	29.9 GB	旧バージョン；中程度で、品質がバランスしており、Q4_K_Mの使用をおすすめします。
Qwen2-VL-72B-Instruct-Q5_0-00002-of-00002.gguf	Q5_0	5	20.2 GB	旧バージョン；中程度で、品質がバランスしており、Q4_K_Mの使用をおすすめします。
Qwen2-VL-72B-Instruct-Q5_K_M-00001-of-00002.gguf	Q5_K_M	5	29.9 GB	大きいですが、品質の損失が非常に低く、推奨されます。
Qwen2-VL-72B-Instruct-Q5_K_M-00002-of-00002.gguf	Q5_K_M	5	24.5 GB	大きいですが、品質の損失が非常に低く、推奨されます。
Qwen2-VL-72B-Instruct-Q5_K_S-00001-of-00002.gguf	Q5_K_S	5	29.8 GB	大きいですが、品質の損失が低く、推奨されます。
Qwen2-VL-72B-Instruct-Q5_K_S-00002-of-00002.gguf	Q5_K_S	5	21.5 GB	大きいですが、品質の損失が低く、推奨されます。
Qwen2-VL-72B-Instruct-Q6_K-00001-of-00003.gguf	Q6_K	6	29.9 GB	非常に大きいですが、品質の損失が極低いです。
Qwen2-VL-72B-Instruct-Q6_K-00002-of-00003.gguf	Q6_K	6	29.9 GB	非常に大きいですが、品質の損失が極低いです。
Qwen2-VL-72B-Instruct-Q6_K-00003-of-00003.gguf	Q6_K	6	4.55 GB	非常に大きいですが、品質の損失が極低いです。
Qwen2-VL-72B-Instruct-Q8_0-00001-of-00003.gguf	Q8_0	8	29.9 GB	非常に大きいですが、品質の損失が極低く、使用をおすすめしません。
Qwen2-VL-72B-Instruct-Q8_0-00002-of-00003.gguf	Q8_0	8	29.8 GB	非常に大きいですが、品質の損失が極低く、使用をおすすめしません。
Qwen2-VL-72B-Instruct-Q8_0-00003-of-00003.gguf	Q8_0	8	17.6 GB	非常に大きいですが、品質の損失が極低く、使用をおすすめしません。
Qwen2-VL-72B-Instruct-f16-00001-of-00005.gguf	f16	16	29.9 GB
Qwen2-VL-72B-Instruct-f16-00002-of-00005.gguf	f16	16	29.7 GB
Qwen2-VL-72B-Instruct-f16-00003-of-00005.gguf	f16	16	29.7 GB
Qwen2-VL-72B-Instruct-f16-00004-of-00005.gguf	f16	16	29.5 GB
Qwen2-VL-72B-Instruct-f16-00005-of-00005.gguf	f16	16	26.6 GB
Qwen2-VL-72B-Instruct-vision-encoder.gguf	f16	16	2.8 GB