V

Vit Bigg 14 CLIPA 336 Datacomp1b

UCSC-VLAAによって開発
CLIPA-v2モデル、効率的な対比式画像テキストモデルで、ゼロショット画像分類タスクに特化
ダウンロード数 259
リリース時間 : 10/17/2023

モデル概要

このモデルはCLIPA-v2アーキテクチャに基づく対比式画像テキストモデルで、特定タスクのファインチューニングなしでゼロショット設定下で画像分類が可能

モデル特徴

効率的なゼロショット学習
特定タスクのファインチューニングなしで正確な画像分類が可能
低コスト高性能
比較的低予算で81.1%のゼロショットImageNet精度を達成
逆スケーリング法則
革新的なトレーニング手法を採用し、逆スケーリング法則に従ってトレーニング効率を向上

モデル能力

ゼロショット画像分類
画像-テキストマッチング
マルチモーダル特徴抽出

使用事例

画像分類
ゼロショット画像認識
トレーニングなしで画像を分類
ImageNetで81.1%のゼロショット精度を達成
コンテンツ検索
画像-テキストマッチング
テキスト記述に基づき関連画像を検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase