llava-v1.6-mistral-7bオープンソースマルチモーダルチャットボット - 無料で利用して多元的な情報交換を実現

Llava V1.6 Mistral 7b

liuhaotianによって開発

LLaVAはオープンソースのマルチモーダルチャットボットで、マルチモーダル指示追従データで大規模言語モデルをファインチューニングして訓練されています。

ダウンロード数 27.45k

リリース時間 : 1/31/2024

モデル概要

LLaVAはtransformerアーキテクチャに基づく自己回帰型言語モデルで、画像とテキスト入力を処理し、テキスト出力を生成できます。

マルチモーダル能力

画像とテキスト入力を同時に処理し、関連するテキスト出力を生成できる

指示追従

マルチモーダル指示追従データで特別に訓練されており、複雑な指示を理解して実行できる

オープンソースモデル

完全にオープンソースで、研究者や開発者が自由に使用・改変できる

画像理解

マルチモーダル対話

視覚的質問応答

指示追従

テキスト生成

研究

マルチモーダルモデル研究

大規模マルチモーダルモデルの行動と能力を研究するために使用

教育

視覚的補助学習

学生が画像とテキストのインタラクションを通じて知識を学ぶのを支援

LLaVAは、マルチモーダルな命令に従うデータで大規模言語モデル（LLM）をファインチューニングすることで学習されたオープンソースのチャットボットです。主に大規模マルチモーダルモデルやチャットボットの研究に利用されます。

LLaVAは、マルチモーダルな命令に従うデータでLLMをファインチューニングすることで学習されたオープンソースのチャットボットです。このモデルは、Transformerアーキテクチャに基づく自己回帰型言語モデルです。

LLaVAは、画像とテキストを入力として受け取り、テキストを出力することができます。主に大規模マルチモーダルモデルやチャットボットの研究に利用されます。

属性	详情
モデルタイプ	LLaVAは、マルチモーダルな命令に従うデータでLLMをファインチューニングすることで学習されたオープンソースのチャットボットです。このモデルは、Transformerアーキテクチャに基づく自己回帰型言語モデルです。ベースのLLMは mistralai/Mistral-7B-Instruct-v0.2 です。
モデルの日付	LLaVA-v1.6-Mistral-7Bは、2023年12月に学習されました。
詳細情報の論文またはリソース	https://llava-vl.github.io/