C

Convnext Xlarge 224 22k

facebookによって開発
ConvNeXTは純粋な畳み込みモデルで、その設計は視覚Transformerからインスピレーションを得ており、視覚Transformerよりも優れた性能を主張しています。このモデルはImageNet-22kデータセットで224x224解像度で学習されています。
ダウンロード数 2,135
リリース時間 : 3/2/2022

モデル概要

ConvNeXTはモダンな純粋畳み込みニューラルネットワークで、主に画像分類タスクに使用されます。ResNetをベースに、Swin Transformerのアイデアを参考に改良されています。

モデル特徴

モダンな畳み込みネットワーク設計
ResNetをベースに、Swin Transformerのアイデアを取り入れてモダン化
高性能
視覚Transformerよりも優れた性能を主張
大規模事前学習
ImageNet-22kデータセットで学習

モデル能力

画像分類
視覚特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
画像をImageNetの22kカテゴリに分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase