S

Siglip2 So400m Patch16 384

googleによって開発
SigLIP 2はSigLIP事前学習目標を基に改良されたモデルで、意味理解、位置特定、密な特徴抽出能力を向上させるために複数の技術を統合しています。
ダウンロード数 7,632
リリース時間 : 2/17/2025

モデル概要

このモデルはゼロショット画像分類や画像テキスト検索などのタスクに直接使用できるほか、視覚言語モデルの視覚エンコーダーとしても利用可能です。

モデル特徴

強化された意味理解
デコーダ損失、グローバル-ローカルとマスク予測損失など、意味理解能力を向上させる複数の技術を統合しています。
ゼロショット画像分類
特定の訓練なしで画像を分類可能で、様々なシーンに適用できます。
密な特徴抽出
画像の密な特徴を抽出可能で、視覚言語モデルや他の視覚タスクに適しています。

モデル能力

ゼロショット画像分類
画像テキスト検索
視覚エンコーディング

使用事例

画像分類
ゼロショット画像分類
特定の訓練なしで画像を分類可能で、様々なシーンに適用できます。
高精度なゼロショット分類効果
視覚エンコーディング
視覚言語モデル
視覚エンコーダーとして、視覚言語モデルに画像特徴を提供します。
効率的な画像特徴抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase