C

Convnext Base 224 22k

facebookによって開発
ConvNeXTは純粋な畳み込みモデルで、その設計は視覚Transformerからインスピレーションを得ており、視覚Transformerよりも優れた性能を主張しています。このモデルは224x224解像度でImageNet-22kデータセットを用いて学習されました。
ダウンロード数 1,797
リリース時間 : 3/2/2022

モデル概要

ConvNeXTは純粋な畳み込みモデル(ConvNet)で、その設計は視覚Transformerからインスピレーションを得ており、後者よりも優れた性能を主張しています。著者らはResNetを出発点とし、Swin Transformerのアイデアを借りて「現代化」を図りました。

モデル特徴

純粋な畳み込みアーキテクチャ
純粋な畳み込みアーキテクチャを採用し、視覚Transformerからインスピレーションを得つつ、より優れた性能を実現
現代化改造
ResNetを出発点とし、Swin Transformerの思想を取り入れて現代化を図った
高解像度学習
224x224解像度で学習されており、高精度な画像分類タスクに適している

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
画像をImageNetの22kカテゴリに分類する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase