V

Vit L 14 CLIPA 336 Datacomp1b

UCSC-VLAAによって開発
CLIPA-v2モデル、効率的な対比型画像テキストモデルで、ゼロショット画像分類タスクに特化しています。
ダウンロード数 239
リリース時間 : 10/17/2023

モデル概要

このモデルはCLIPA-v2アーキテクチャに基づく対比型画像テキストモデルで、主にゼロショット画像分類に使用されます。大規模データセットでトレーニングされており、ファインチューニングなしで画像を分類できます。

モデル特徴

効率的なゼロショット分類
ファインチューニングなしで直接画像分類タスクを実行できます。
大規模トレーニングデータ
mlfoundations/datacomp_1bデータセットを使用してトレーニングされ、幅広い視覚概念をカバーしています。
逆比例スケーリング最適化
CLIPA-v2の逆比例スケーリングトレーニング手法を採用し、効率的な性能を実現しています。

モデル能力

ゼロショット画像分類
画像テキスト対比学習
マルチラベル画像認識

使用事例

画像分類
ゼロショット画像分類
トレーニング不要で画像を分類でき、迅速なデプロイメントシナリオに適しています。
ImageNetで81.1%のゼロショット精度を達成
コンテンツ理解
画像テキストマッチング
画像とテキスト記述の一致度を判断します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase