オープンソースのマルチモーダルチャットボット llava-v1.6-vicuna-7b-gguf - 無料でデプロイ可能、複数の量子化オプションあり

Llava V1.6 Vicuna 7b Gguf

cjpaisによって開発

LLaVAはオープンソースのマルチモーダルチャットボットで、マルチモーダル命令追従データでLLMをファインチューニングしてトレーニングされています。このバージョンはGGUF量子化バージョンで、複数の量子化オプションを提供しています。

ダウンロード数 493

リリース時間 : 2/17/2024

モデル概要

LLaVAはTransformerアーキテクチャに基づく自己回帰型言語モデルで、画像とテキスト入力を処理し、テキスト出力を生成できます。主に大規模マルチモーダルモデルとチャットボットの研究に使用されます。

マルチモーダル能力

画像とテキスト入力を同時に処理し、関連するテキスト出力を生成できる

複数量子化オプション

3ビットから8ビットまでの複数の量子化バージョンを提供し、さまざまなハードウェアと性能ニーズに対応

オープンソース

Apache-2.0ライセンスを採用し、自由な使用と改変を許可

画像理解

テキスト生成

マルチモーダル対話

視覚的質問応答

研究

マルチモーダルモデル研究

コンピュータビジョンと自然言語処理のクロスドメイン研究に使用

アプリケーション開発

インテリジェントチャットボット

画像内容を理解できる対話システムの開発

PR #5267から量子化とプロジェクターを更新しました。

名前	量子化方法	ビット数	サイズ	使用ケース
llava-v1.6-vicuna-7b.Q3_K_XS.gguf	Q3_K_XS	3	2.77 GB	非常に小さいが、品質の損失が大きい
llava-v1.6-vicuna-7b.Q3_K_M.gguf	Q3_K_M	3	3.3 GB	非常に小さいが、品質の損失が大きい
llava-v1.6-vicuna-7b.Q4_K_M.gguf	Q4_K_M	4	4.08 GB	中程度で、品質がバランスしている - 推奨
llava-v1.6-vicuna-7b.Q5_K_S.gguf	Q5_K_S	5	4.65 GB	大きいが、品質の損失が小さい - 推奨
llava-v1.6-vicuna-7b.Q5_K_M.gguf	Q5_K_M	5	4.78 GB	大きく、品質の損失が非常に小さい - 推奨
llava-v1.6-vicuna-7b.Q6_K.gguf	Q6_K	6	5.53 GB	非常に大きく、品質の損失が極めて小さい
llava-v1.6-vicuna-7b.Q8_0.gguf	Q8_0	8	7.16 GB	非常に大きく、品質の損失が極めて小さい - 推奨しない

属性	詳情
モデルタイプ	LLaVAは、多モーダル命令追従データでLLMをファインチューニングすることで学習されたオープンソースのチャットボットです。Transformerアーキテクチャに基づく自己回帰型言語モデルです。ベースのLLMはlmsys/vicuna-7b-v1.5です。
モデルの作成日	LLaVA-v1.6-Vicuna-7Bは2023年12月に学習されました。
詳細情報の論文またはリソース	https://llava-vl.github.io/

モデルに関する質問やコメントを送る場所: https://github.com/haotian-liu/LLaVA/issues

属性	詳情
主な想定用途	LLaVAの主な用途は、大規模多モーダルモデルとチャットボットの研究です。
主な想定ユーザー	このモデルの主な想定ユーザーは、コンピュータビジョン、自然言語処理、機械学習、人工知能の研究者と愛好家です。