Qwen2.5-VL-7B-Instruct-Q4_K_M-GGUFオープンソースマルチモーダルモデル - 無料でデプロイ可能、画像とテキスト入力に対応

ホーム

Qwen2.5 VL 7B Instruct Q4 K M GGUF

PatataAlienaによって開発

これはQwen2.5-VL-7B-InstructモデルのGGUF量子化バージョンで、マルチモーダルタスクに適しており、画像とテキスト入力をサポートします。

画像生成テキスト英語オープンソースライセンス:Apache-2.0 #マルチモーダル対話 #軽量展開 #中国語コマンド理解

ダウンロード数 69

リリース時間 : 3/31/2025

モデル概要

Qwen2.5-VL-7B-Instructから変換されたGGUF形式モデルで、画像テキストからテキストへのマルチモーダルタスクに適しています。

モデル特徴

マルチモーダルサポート

画像とテキスト入力をサポートし、複雑なマルチモーダルタスクを処理できます。

GGUFフォーマット

GGUFフォーマットを採用しており、llama.cppなどのツールで簡単に使用できます。

量子化バージョン

Q4_K_M量子化を施しており、モデル性能とリソース消費のバランスを取っています。

モデル能力

画像理解

テキスト生成

マルチモーダル推論

使用事例

マルチモーダルインタラクション

画像キャプション生成

入力画像に基づいて詳細なテキスト説明を生成します。

正確で表現力豊かな画像説明を生成します。

視覚的質問応答

入力画像の内容に関する質問に答えます。

画像内容に関連する正確な回答を提供します。

🚀 PatataAliena/Qwen2.5-VL-7B-Instruct-Q4_K_M-GGUF

このモデルは、llama.cppを使用してQwen/Qwen2.5-VL-7B-InstructからGGUF形式に変換されました。変換にはggml.aiのGGUF-my-repoスペースを利用しています。モデルの詳細については、元のモデルカードを参照してください。

🚀 クイックスタート

このモデルは、Qwen/Qwen2.5-VL-7B-InstructをGGUF形式に変換したもので、llama.cppを通じて使用できます。

✨ 主な機能

マルチモーダル処理が可能です。
llama.cppを使用してGGUF形式で動作します。

📦 インストール

llama.cppのインストール

brewを通じてllama.cppをインストールします（MacとLinuxで動作します）。

brew install llama.cpp

💻 使用例

llama.cppのCLIを使用する場合

llama-cli --hf-repo PatataAliena/Qwen2.5-VL-7B-Instruct-Q4_K_M-GGUF --hf-file qwen2.5-vl-7b-instruct-q4_k_m.gguf -p "The meaning to life and the universe is"

llama.cppのサーバーを使用する場合

llama-server --hf-repo PatataAliena/Qwen2.5-VL-7B-Instruct-Q4_K_M-GGUF --hf-file qwen2.5-vl-7b-instruct-q4_k_m.gguf -c 2048

別の使用方法

llama.cppをGitHubからクローンします。

git clone https://github.com/ggerganov/llama.cpp

llama.cppのフォルダに移動し、LLAMA_CURL=1フラグと他のハードウェア固有のフラグ（例：LinuxのNvidia GPUの場合はLLAMA_CUDA=1）でビルドします。

cd llama.cpp && LLAMA_CURL=1 make

メインバイナリを通じて推論を実行します。

./llama-cli --hf-repo PatataAliena/Qwen2.5-VL-7B-Instruct-Q4_K_M-GGUF --hf-file qwen2.5-vl-7b-instruct-q4_k_m.gguf -p "The meaning to life and the universe is"

または

./llama-server --hf-repo PatataAliena/Qwen2.5-VL-7B-Instruct-Q4_K_M-GGUF --hf-file qwen2.5-vl-7b-instruct-q4_k_m.gguf -c 2048

📄 ライセンス

このモデルは、Apache 2.0ライセンスの下で提供されています。

📚 ドキュメント

プロパティ	詳細
ベースモデル	`Qwen/Qwen2.5-VL-7B-Instruct`
言語	en
ライブラリ名	transformers
パイプラインタグ	image-text-to-text
タグ	multimodal, llama-cpp, gguf-my-repo