S

Siglip Base Patch16 224

Xenovaによって開発
SigLIPは視覚と言語の事前学習に基づくモデルで、ゼロショット画像分類タスクに適しています。
ダウンロード数 182
リリース時間 : 12/23/2023

モデル概要

SigLIPは視覚と言語情報を統合した事前学習モデルで、主にゼロショット画像分類タスクに使用され、テキスト記述に基づいて画像を分類できます。

モデル特徴

ゼロショット画像分類
訓練なしでテキスト記述に基づいて画像を分類できます。
視覚-言語事前学習
視覚と言語情報を統合した事前学習により、モデルのマルチモーダル理解能力を向上させます。
ONNX互換
ONNX形式をサポートしており、Web端末での展開と使用が容易です。

モデル能力

ゼロショット画像分類
テキスト埋め込みベクトル計算
視覚埋め込みベクトル計算

使用事例

画像分類
動物認識
画像中の動物の種類(猫、犬など)を識別します。
画像中の動物の種類を正確に識別できます。
マルチモーダルアプリケーション
画像-テキストマッチング
画像とテキスト記述をマッチングさせ、検索や分類に使用します。
画像とテキスト記述を効果的にマッチングできます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase