C

CLIP ViT G 14 Laion2b S34b B88k

laionによって開発
LAION-2Bデータセットで訓練されたCLIP ViT-g/14モデル、ゼロショット画像分類と画像テキスト検索タスクをサポート
ダウンロード数 76.65k
リリース時間 : 3/6/2023

モデル概要

これはLAION-5B英語サブセットLAION-2Bで訓練されたCLIP ViT-g/14モデルで、OpenCLIPフレームワークを使用して実装されており、主にゼロショット画像分類や画像テキスト検索などのタスクに使用されます。

モデル特徴

大規模訓練
LAION-2Bデータセット(20億サンプル)を使用して訓練され、強力な汎化能力を持つ
ゼロショット学習
特定のタスクの微調整なしで画像分類や検索タスクを実行可能
高性能
ImageNet-1kで78.4%のゼロショットtop-1精度を達成

モデル能力

ゼロショット画像分類
画像テキスト検索
画像特徴抽出
テキスト特徴抽出

使用事例

コンピュータビジョン
画像分類
訓練なしで画像を分類可能
ImageNet-1kで78.4%の精度を達成
画像検索
テキスト記述に基づいて関連画像を検索
研究
マルチモーダル学習研究
視覚-言語連合表現学習の研究に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase