C

CLIP ViT B 16 DataComp.XL S13b B90k

flavourによって開発
これはDataComp-1BデータセットでトレーニングされたCLIP ViT-L/14モデルで、ゼロショット画像分類と画像テキスト検索タスクをサポートします。
ダウンロード数 39.22k
リリース時間 : 7/27/2023

モデル概要

このモデルはOpenCLIPフレームワークを使用してDataComp-1Bデータセットでトレーニングされ、主にゼロショット画像分類とクロスモーダル検索タスクの研究に使用されます。

モデル特徴

大規模トレーニングデータ
DataComp-1Bデータセットの14億サンプルを使用してトレーニング
ゼロショット能力
微調整なしでさまざまな画像分類タスクを実行可能
クロスモーダル理解
画像とテキスト間の関連性を理解可能

モデル能力

ゼロショット画像分類
画像テキスト検索
クロスモーダル理解

使用事例

研究
ゼロショット画像分類研究
異なる分類体系下でのモデルのパフォーマンスを探索
ImageNet-1kで79.2%のゼロショットtop-1精度を達成
コンテンツ管理
画像検索
テキスト記述に基づいて関連画像を検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase