C

Convnext Large 224

facebookによって開発
ConvNeXTは純粋な畳み込みモデルで、視覚Transformerからインスピレーションを得た設計で、ImageNet-1kデータセットで224x224解像度でトレーニングされました。
ダウンロード数 740
リリース時間 : 3/2/2022

モデル概要

ConvNeXTは現代的な畳み込みニューラルネットワークで、Transformerの設計理念を取り入れることで、画像分類タスクで優れた性能を発揮します。

モデル特徴

現代化畳み込み設計
ResNetを出発点とし、Swin Transformerの設計理念を参考に現代化改造を実施
Transformerを上回る性能
画像分類タスクにおいて視覚Transformerを上回る性能を主張
高解像度対応
224x224解像度の画像入力をサポート

モデル能力

画像分類
視覚特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
画像をImageNetの1,000カテゴリに分類
ImageNet-1kデータセットで優れた性能
物体認識
画像中の物体カテゴリを識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase