V

Vit SO400M 16 SigLIP I18n 256

timmによって開発
多言語WebLIデータセットで訓練されたSigLIP(言語画像事前訓練のSigmoid損失)モデルで、多言語画像分類タスクをサポートします。
ダウンロード数 82
リリース時間 : 10/9/2024

モデル概要

このモデルはSigLIPアーキテクチャに基づくコントラスティブ画像-テキストモデルで、ゼロショット画像分類タスク専用に設計され、多言語処理をサポートします。

モデル特徴

多言語サポート
多言語トークナイザーを使用して訓練され、複数言語の画像分類タスクをサポートします。
Sigmoid損失関数
言語画像事前訓練にSigmoid損失を採用し、モデルの分類性能を向上させました。
ゼロショット分類能力
特定の訓練なしに新しいカテゴリの画像分類が可能です。

モデル能力

ゼロショット画像分類
多言語テキスト理解
画像特徴抽出

使用事例

画像分類
多言語画像タグ付け
多言語テキストラベルを使用して画像を分類
画像内容を正確に識別し多言語ラベルとマッチング可能
クロスランゲージ画像検索
異なる言語クエリで関連画像を検索
言語を跨いだ画像検索能力を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase