V

Vit L 16 SigLIP 256

timmによって開発
WebLIデータセットで訓練されたSigLIP(Sigmoid損失を用いた言語画像事前学習)モデルで、ゼロショット画像分類タスクに使用されます。
ダウンロード数 1,516
リリース時間 : 10/16/2023

モデル概要

このモデルは対比画像-テキストモデルで、Sigmoid損失関数を用いて事前学習されており、ゼロショット画像分類タスクをサポートします。

モデル特徴

Sigmoid損失関数
Sigmoid損失関数を用いた言語画像事前学習により、モデルの対比学習効果が向上しました。
ゼロショット分類
ゼロショット画像分類をサポートし、特定タスクのファインチューニングなしで新しいクラスに適用可能です。
多フレームワーク対応
OpenCLIP(画像+テキスト)とtimm(画像のみ)の両フレームワークに対応し、柔軟に使用できます。

モデル能力

画像特徴抽出
テキスト特徴抽出
ゼロショット画像分類
画像-テキスト対比学習

使用事例

画像分類
ゼロショット画像分類
ファインチューニングなしで新しい画像クラスを分類できます。
画像検索
テキストベースの画像検索
テキスト記述に基づいて関連画像を検索します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase