C

CLIP Convnext Large D.laion2b S26b B102k Augreg

laionによって開発
LAION-2Bデータセットでトレーニングされた大規模ConvNeXt-Large CLIPモデル、ゼロショット画像分類と画像テキスト検索タスクをサポート
ダウンロード数 80.74k
リリース時間 : 1/29/2023

モデル概要

このモデルはConvNeXt-Largeアーキテクチャを採用し、強化されたデータ拡張と正則化技術でトレーニングされ、ImageNetゼロショット分類タスクで75.9%の精度を達成

モデル特徴

ConvNeXtアーキテクチャの革新
大規模トレーニングされた最初のConvNeXt CLIPモデルで、従来のViTアーキテクチャに比べて計算効率が大幅に向上
強化されたデータ拡張
ランダムスケールクロップ(RRC)、ランダム消去(RE)、ランダム深度(SD)などの先進的な正則化技術を採用し、モデルの堅牢性を向上
効率的なトレーニング
256解像度でViT-L/16の半分の計算量のみでより高い性能を実現

モデル能力

ゼロショット画像分類
画像テキスト類似度計算
クロスモーダル検索

使用事例

画像理解
ゼロショット画像分類
ファインチューニングなしで新しい画像を分類可能
ImageNet-1kゼロショット精度75.9%
クロスモーダル検索
画像テキスト検索
テキストに基づいて関連画像を検索、または画像から説明を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase