C

CLIP Convnext Large D 320.laion2B S29b B131k Ft Soup

laionによって開発
ConvNeXt-Largeアーキテクチャに基づくCLIPモデルで、LAION-2Bデータセットで訓練され、ゼロショット画像分類と画像テキスト検索タスクをサポート
ダウンロード数 83.56k
リリース時間 : 2/11/2023

モデル概要

これはConvNeXt-Largeアーキテクチャに基づくCLIPモデルで、OpenCLIPフレームワークを使用してLAION-2Bデータセットで訓練されました。モデルはゼロショット画像分類や画像テキスト検索などのタスクをサポートし、高い画像理解能力を持っています。

モデル特徴

高解像度処理能力
320x320解像度入力をサポートし、標準的な256x256モデルに比べてより優れた詳細処理能力を提供
重み平均最適化
複数の微調整重み平均(soup)技術を採用し、モデル性能を向上
効率的なアーキテクチャ設計
ConvNeXt-Large-Dアーキテクチャは320x320解像度で類似モデルよりも効率的

モデル能力

ゼロショット画像分類
画像テキスト検索
クロスモーダル理解
画像特徴抽出

使用事例

画像分類
ゼロショット画像分類
特定の訓練なしで画像を分類可能
ImageNet-1kで76.9%のゼロショットTop-1精度を達成
情報検索
画像テキスト検索
テキストクエリに基づいて関連画像を検索、または画像に基づいて関連テキストを検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase