C

Convnextv2 Femto.fcmae

timmによって開発
ConvNeXt-V2ベースの自己教師あり特徴表現モデルで、完全畳み込みマスク自己符号化器フレームワーク(FCMAE)を使用して事前学習されています。
ダウンロード数 166
リリース時間 : 1/5/2023

モデル概要

このモデルは画像分類/特徴バックボーンネットワークで、ファインチューニングや特徴抽出タスクに適しており、事前学習済みヘッドは含まれていません。

モデル特徴

自己教師あり事前学習
完全畳み込みマスク自己符号化器フレームワーク(FCMAE)を使用して事前学習されており、ラベル付きデータなしで効果的な特徴表現を学習できます。
軽量設計
わずか480万パラメータと0.8 GMACsの計算量で、リソースが限られた環境に適しています。
マルチタスクサポート
画像分類、特徴マップ抽出、画像埋め込みなど、さまざまなコンピュータビジョンタスクをサポートしています。

モデル能力

画像特徴抽出
画像分類
画像埋め込み生成

使用事例

コンピュータビジョン
画像分類
入力画像を分類し、クラス確率分布を出力します。
ImageNet-1kデータセットで良好なパフォーマンスを示しています
特徴抽出
画像の多層特徴マップを抽出し、物体検出やセグメンテーションなどの下流タスクに使用できます。
異なるスケールの特徴マップを出力します
画像検索
画像埋め込みを通じて類似画像検索を実現します。
コンパクトな画像表現ベクトルを生成します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase