M

Mobileclip B OpenCLIP

appleによって開発
MobileCLIP-Bは効率的な画像テキストモデルで、マルチモーダル強化トレーニングにより高速推論を実現し、ゼロショット画像分類タスクで優れた性能を発揮します。
ダウンロード数 715
リリース時間 : 6/7/2024

モデル概要

MobileCLIPは、効率的なゼロショット画像分類のために設計された高速画像テキストモデルです。マルチモーダル強化トレーニング手法により、モデルサイズを小さく保ちながら、より大きなモデルに匹敵する性能を実現しています。

モデル特徴

効率的な性能
モデルサイズを小さく保ちながら、より大きなモデルに匹敵する性能を実現
高速推論
画像+テキスト処理の総遅延はわずか13.7ms(MobileCLIP-B)
マルチモーダルトレーニング
マルチモーダル強化トレーニング手法を採用してモデル性能を向上
ゼロショット能力
未見のカテゴリに対して強力なゼロショット分類能力を発揮

モデル能力

ゼロショット画像分類
画像テキストマッチング
マルチモーダル理解

使用事例

コンピュータビジョン
画像分類
特定のトレーニングなしで画像を分類可能
ImageNet-1kで76.8%のゼロショット精度を達成
画像テキスト検索
テキスト記述に基づいて関連画像を検索
モバイルアプリケーション
モバイル端末向け視覚検索
モバイルデバイスで効率的な視覚検索機能を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase