# マルチモーダルエンコーダ

Siglip2 Base Patch16 224
Apache-2.0
SigLIP 2はSigLIPを改良した多言語視覚言語エンコーダで、意味理解、位置特定、密な特徴抽出能力が強化されています。
画像生成テキスト Transformers
S
google
44.75k
38
Siglip2 So400m Patch16 Naflex
Apache-2.0
SigLIP 2はSigLIP事前学習目標を基に改良されたモデルで、意味理解、位置特定、高密度特徴抽出能力を向上させるために複数の技術を統合しています。
テキスト生成画像 Transformers
S
google
159.81k
21
Siglip2 So400m Patch16 256
Apache-2.0
SigLIP 2はSigLIPをベースに改良されたモデルで、意味理解、位置特定、密な特徴抽出能力を向上させるために複数の技術が統合されています。
テキスト生成画像 Transformers
S
google
2,729
0
Siglip2 Giant Opt Patch16 384
Apache-2.0
SigLIP 2はSigLIP事前学習目標を基に改良されたモデルで、意味理解、位置特定、密な特徴抽出能力を向上させるために複数の技術が統合されています。
テキスト生成画像 Transformers
S
google
26.12k
14
Siglip2 Large Patch16 512
Apache-2.0
SigLIP 2はSigLIPをベースに改良されたモデルで、意味理解、位置特定、密な特徴抽出能力を向上させるために複数の技術が統合されています。
テキスト生成画像 Transformers
S
google
4,416
8
Siglip2 Large Patch16 256
Apache-2.0
SigLIP 2 は SigLIP を改良した視覚言語モデルで、意味理解、位置特定、高密度特徴抽出能力を向上させるために複数の技術を統合しています。
テキスト生成画像 Transformers
S
google
10.89k
3
Siglip2 Base Patch16 512
Apache-2.0
SigLIP 2は、意味理解、位置特定、密な特徴抽出能力を向上させるために複数の技術を統合した視覚言語モデルです。
テキスト生成画像 Transformers
S
google
28.01k
10
Siglip2 Base Patch16 256
Apache-2.0
SigLIP 2は多言語の視覚言語エンコーダで、意味理解、位置特定、高密度特徴抽出能力が向上しています。
画像生成テキスト Transformers
S
google
45.24k
4
Siglip2 Base Patch32 256
Apache-2.0
SigLIP 2はSigLIPを基に改良されたバージョンで、意味理解、位置特定、密な特徴抽出能力を向上させるために複数の技術が統合されています。
テキスト生成画像 Transformers
S
google
9,419
4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase