C

Convnext Base 224

facebookによって開発
ConvNeXTは純粋な畳み込みモデルで、ビジュアルTransformerからインスピレーションを得て設計され、ImageNet - 1kデータセットで訓練され、画像分類タスクに使用されます。
ダウンロード数 2,756
リリース時間 : 3/2/2022

モデル概要

ConvNeXTは現代的な畳み込みニューラルネットワークで、Swin Transformerのアイデアを借りてResNetを改造し、ビジュアルTransformerよりも性能が優れていると主張されています。

モデル特徴

現代的な畳み込み設計
ビジュアルTransformerの利点を借りて、従来の畳み込みネットワークを現代化改造します。
高性能
画像分類タスクでビジュアルTransformerよりも性能が優れていると主張されています。
純粋な畳み込みアーキテクチャ
純粋な畳み込み構造を維持しながら、Transformerと同等の性能を得ます。

モデル能力

画像分類
ビジュアル特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
画像をImageNetの1,000のカテゴリに分類します。
物体認識
画像内の物体のカテゴリを識別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase