# 軽量級VLM

Paligemma 3b Ft Scicap 448
PaliGemmaは、画像とテキストの入力を組み合わせてテキスト出力を生成する、多機能の軽量級ビジュアル言語モデルで、多言語をサポートしています。
テキスト生成画像 Transformers
P
google
123
0
Paligemma 3b Ft Cococap 224
PaliGemmaは、多言語の入出力をサポートする、多機能な軽量級ビジュアル言語モデル(VLM)です。様々なビジュアル言語タスクに適しています。
画像生成テキスト Transformers
P
google
209
1
Paligemma 3b Pt 896
PaliGemmaは、画像とテキストの入力をサポートし、テキスト出力を生成する多機能の軽量級視覚言語モデル(VLM)で、多言語能力を備えています。
画像生成テキスト Transformers
P
google
1,788
119
Paligemma 3b Ft Nlvr2 224
PaliGemmaは、多言語の入出力をサポートする、画像キャプションや視覚的質問応答などのさまざまな視覚言語タスクに長けた、多機能の軽量級視覚言語モデル(VLM)です。
テキスト生成画像 Transformers
P
google
2,056
1
Paligemma 3b Ft Nlvr2 448
PaliGemmaは、画像とテキストの入力をサポートし、テキスト出力を生成する、多機能で軽量級のビジュアル言語モデル(VLM)です。さまざまなビジュアル言語タスクに適しています。
テキスト生成画像 Transformers
P
google
2,350
0
Paligemma 3b Ft Rsvqa Lr 224
PaliGemmaは、画像とテキストの入力を組み合わせてテキスト出力を生成する、多機能の軽量級ビジュアル言語モデル(VLM)で、多言語をサポートしています。
テキスト生成画像 Transformers
P
google
223
0
Paligemma 3b Ft Scicap 224
PaliGemmaは軽量級のビジュアル言語モデルで、画像とテキストの入力を組み合わせてテキスト出力を生成し、多言語と多タスク処理をサポートします。
画像生成テキスト Transformers
P
google
107
0
Paligemma 3b Ft Ocrvqa 896
PaliGemmaは、画像とテキストの入力をサポートし、テキスト出力を生成する多機能の軽量級ビジュアル言語モデルで、さまざまなビジュアル言語タスクに適しています。
画像生成テキスト Transformers
P
google
2,056
14
Paligemma 3b Ft Science Qa 224
PaliGemmaは、画像とテキストの入力をサポートし、テキスト出力を生成する、多機能の軽量級ビジュアル言語モデル(VLM)です。様々なビジュアル言語タスクに適しています。
テキスト生成画像 Transformers
P
google
113
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase