C

Convnext Base.clip Laion2b Augreg

timmによって開発
CLIPフレームワークに基づくConvNeXt Base画像エンコーダー、LAION-2Bデータセットでトレーニングされ、画像特徴抽出をサポート
ダウンロード数 522
リリース時間 : 12/24/2024

モデル概要

このモデルはCLIPフレームワークの画像エンコーダー部分で、ConvNeXt Baseアーキテクチャを採用し、LAION-2Bデータセットでトレーニングされており、効率的に画像特徴を抽出でき、視覚-言語タスクに適しています。

モデル特徴

効率的な画像特徴抽出
ConvNeXt Baseアーキテクチャを採用し、画像から意味のある特徴を効率的に抽出できる
大規模データセットでのトレーニング
LAION-2Bデータセットでトレーニングされており、強力な汎化能力を持つ
CLIPフレームワーク互換
CLIPフレームワークの画像エンコーダー部分として、テキストエンコーダーと連携してクロスモーダルタスクを完了できる

モデル能力

画像特徴抽出
視覚表現学習
クロスモーダルアラインメント

使用事例

コンピュータビジョン
画像検索
画像特徴を抽出することで効率的な画像検索を実現
視覚-言語タスク
CLIPフレームワークの一部として、画像-テキストマッチングなどのタスクに使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase