Spydaz Web AI Llava
LLaVaはオープンソースのマルチモーダルチャットボットで、LLaMA/VicunaをGPT生成のマルチモーダル指示追従データでファインチューニングしたもので、チャット/指示に最適化されたマルチモーダル版LLMです。
画像生成テキスト
Transformers 複数言語対応

_
LeroyDyer
30
1
Table Llava V1.5 7b
Table LLaVA 7Bは、様々な表画像を理解し多様な表関連タスクを遂行するために設計されたオープンソースのマルチモーダルチャットボットです。
画像生成テキスト
Transformers 英語

T
SpursgoZmy
165
12
Llava NeXT Video 7B DPO Hf
LLaVA-NeXT-Videoはオープンソースのマルチモーダルチャットボットで、動画と画像データの混合トレーニングにより最適化され、優れた動画理解能力を備えています。
ビデオ生成テキスト
Transformers 英語

L
llava-hf
12.61k
9
MQT LLaVA 7b
MQT-LLaVAはオープンソースのマルチモーダルチャットボットモデルで、Transformerアーキテクチャに基づき、GPTで生成されたマルチモーダル指令データ上でLLaMA/Vicunaを微調整して訓練されました。
テキスト生成画像
Transformers

M
gordonhu
349
5
Denseconnector V1.5 8B
DenseConnectorはオープンソースのチャットボットで、LLaMA/Vicunaをファインチューニングし、GPTが生成したマルチモーダル指示追従データでトレーニングされています。
画像生成テキスト
Transformers

D
HuanjinYao
17
7
Pllava 7b
Apache-2.0
PLLaVAはオープンソースのビデオ言語チャットボットで、ビデオ指令追従データで画像大規模言語モデルを微調整することで得られ、マルチモーダル大規模モデルとチャットボットの研究に使用できます。
テキスト生成ビデオ
Transformers

P
ermu2001
109
13
Vsft Llava 1.5 7b Hf Trl
LLaVA-1.5-7Bモデルを基に視覚的監督ファインチューニング(VSFT)で訓練されたマルチモーダル視覚言語モデルで、画像理解と対話生成をサポート
画像生成テキスト
Transformers 英語

V
HuggingFaceH4
65
14
MGM 7B
MGM-7BはVicuna-7B-v1.5をベースに訓練されたオープンソースのマルチモーダルチャットボットで、高精細画像の理解、推論、生成をサポートします。
テキスト生成画像
Transformers

M
YanweiLi
975
8
Llava V1.5 7b Gguf
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを微調整し、GPTが生成したマルチモーダル命令追従データに基づいてトレーニングされています。
画像生成テキスト
L
granddad
13
0
Llava V1.6 Vicuna 7b
LLaVAはオープンソースのマルチモーダルチャットボットで、マルチモーダル指示追従データを用いた大規模言語モデルのファインチューニングによって訓練されています。
テキスト生成画像
Transformers

L
liuhaotian
31.65k
123
Llava V1.6 34b
Apache-2.0
LLaVAはオープンソースのマルチモーダルチャットボットで、大規模言語モデルのファインチューニングにより訓練され、画像とテキストのインタラクションをサポートします。
テキスト生成画像
L
liuhaotian
9,033
351
Llava Phi 2 3b
MIT
LLaVa-Phi-2-3Bはオープンソースのマルチモーダルチャットボットモデルで、Phi-2アーキテクチャを基にファインチューニングされ、画像とテキスト入力を処理し自然言語応答を生成できます。
テキスト生成画像
Transformers 英語

L
marianna13
153
13
Vip Llava 7b
ViP-LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを画像と地域レベルの命令データで微調整してトレーニングされています。
テキスト生成画像
Transformers

V
mucai
66.75k
8
Llama Vid 7b Full 224 Video Fps 1
LLaMA-VIDはLLaMA/Vicunaをファインチューニングしたオープンソースのマルチモーダルチャットボットで、拡張されたコンテキストトークンにより数時間に及ぶ動画処理をサポートします。
テキスト生成ビデオ
Transformers

L
YanweiLi
86
9
Llava V1.5 13b Lora
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを微調整し、GPTが生成したマルチモーダル命令追従データに基づいてトレーニングされています。
テキスト生成画像
Transformers

L
liuhaotian
143
26
Llava V1.5 13B AWQ
LLaVAはオープンソースのマルチモーダルチャットボットで、GPTが生成したマルチモーダル命令追従データを用いてLLaMA/Vicunaをファインチューニングしてトレーニングされています。
テキスト生成画像
Transformers

L
TheBloke
141
35
Llava V1.5 Mlp2x 336px Pretrain Vicuna 13b V1.5
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/VicunaをGPT生成のマルチモーダル指示追従データでファインチューニングして作成されました。
テキスト生成画像
Transformers

L
liuhaotian
66
2
Llava V1.5 Mlp2x 336px Pretrain Vicuna 7b V1.5
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaをファインチューニングし、GPTで生成されたマルチモーダル指示追従データでトレーニングされています。
テキスト生成画像
Transformers

L
liuhaotian
173
17
Llava V1.5 7b
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaをファインチューニングし、画像とテキストのインタラクションをサポートします。
画像生成テキスト
Transformers

L
liuhaotian
1.4M
448
Llava Pretrain Vicuna 7b V1.3
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを基にGPTが生成したマルチモーダル指示追従データでファインチューニングされています。
テキスト生成画像
Transformers

L
liuhaotian
54
1
Llava Llama 2 7b Chat Lightning Lora Preview
LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaをファインチューニングし、GPTで生成されたマルチモーダル指示追従データでトレーニングされています。
テキスト生成画像
Transformers

L
liuhaotian
251
12
Stable Vicuna 13B GPTQ
StableVicuna-13BはVicuna-13B v0モデルをベースに、RLHFで微調整された対話モデルで、4ビットGPTQ量子化形式を採用しています。
大規模言語モデル
Transformers 英語

S
TheBloke
49
219
Vicuna 13b 1.1
Apache-2.0
VicunaはLLaMAをベースに微調整されたオープンソースのチャットボットで、ユーザーが共有した対話データを使って訓練され、学術研究に適しています。
大規模言語モデル
Transformers

V
eachadea
181
137
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98