llava-1.5-7b-hf-Q4_K_M-GGUFオープンソースモデル - 無料で画像テキスト生成タスクをサポート

ホーム

Llava 1.5 7b Hf Q4 K M GGUF

Marwan02によって開発

このモデルはllava-hf/llava-1.5-7b-hfから変換されたGGUF形式モデルで、画像テキスト生成タスクをサポートします。

画像生成テキスト英語#マルチモーダルQA #画像テキスト生成 #軽量デプロイ

ダウンロード数 30

リリース時間 : 5/14/2025

モデル概要

これは視覚-言語モデルで、入力された画像に基づいて関連するテキスト記述を生成したり、画像に関する質問に答えたりできます。

モデル特徴

GGUF形式サポート

モデルはGGUF形式に変換されており、llama.cppなどのツールで簡単に使用可能

マルチモーダル能力

視覚と言語情報を同時に処理し、画像からテキストへの変換を実現

量子化バージョン

Q4_K_M量子化バージョンを提供し、モデル性能とリソース使用量のバランスを取っている

モデル能力

画像キャプション生成

視覚的質問応答

マルチモーダル理解

使用事例

コンテンツ生成

自動画像タグ付け

画像に対して自動的に記述テキストを生成

画像検索と分類効率の向上

支援ツール

視覚支援

視覚障害者が画像内容を理解するのを支援

アクセシビリティ体験の向上

🚀 Marwan02/llava-1.5-7b-hf-Q4_K_M-GGUF

このモデルは、llava-hf/llava-1.5-7b-hf から、llama.cpp を使用して ggml.ai の GGUF-my-repo スペースを介して GGUF 形式に変換されました。モデルの詳細については、元のモデルカードを参照してください。

🚀 クイックスタート

📦 インストール

llama.cpp を brew を通じてインストールします（Mac と Linux で動作します）。

brew install llama.cpp

💻 使用例

基本的な使用法

llama.cpp のサーバーまたは CLI を起動します。

CLI:

llama-cli --hf-repo Marwan02/llava-1.5-7b-hf-Q4_K_M-GGUF --hf-file llava-1.5-7b-hf-q4_k_m.gguf -p "The meaning to life and the universe is"

サーバー:

llama-server --hf-repo Marwan02/llava-1.5-7b-hf-Q4_K_M-GGUF --hf-file llava-1.5-7b-hf-q4_k_m.gguf -c 2048

高度な使用法

このチェックポイントは、Llama.cpp リポジトリに記載されている使用手順を直接通じても使用できます。

ステップ 1: GitHub から llama.cpp をクローンします。

git clone https://github.com/ggerganov/llama.cpp

ステップ 2: llama.cpp フォルダに移動し、LLAMA_CURL=1 フラグと他のハードウェア固有のフラグ（例: Linux の Nvidia GPU の場合は LLAMA_CUDA=1）を使用してビルドします。

cd llama.cpp && LLAMA_CURL=1 make

ステップ 3: メインバイナリを通じて推論を実行します。

./llama-cli --hf-repo Marwan02/llava-1.5-7b-hf-Q4_K_M-GGUF --hf-file llava-1.5-7b-hf-q4_k_m.gguf -p "The meaning to life and the universe is"

または

./llama-server --hf-repo Marwan02/llava-1.5-7b-hf-Q4_K_M-GGUF --hf-file llava-1.5-7b-hf-q4_k_m.gguf -c 2048

📄 ライセンス

このモデルは Llama2 ライセンスの下で提供されています。

📋 モデル情報

属性	详情
モデルタイプ	このモデルは、`llava-hf/llava-1.5-7b-hf` から GGUF 形式に変換されたものです。
訓練データ	liuhaotian/LLaVA-Instruct-150K
言語	en
パイプラインタグ	image-text-to-text
タグ	vision、image-text-to-text、llama-cpp、gguf-my-repo
arXiv	2304.08485