C

Convnext Large 224 22k

facebookによって開発
ConvNeXTは純粋な畳み込みモデルで、視覚Transformerの設計に触発され、ImageNet-22kデータセットで訓練され、Transformerを凌駕する性能を発揮します。
ダウンロード数 1,425
リリース時間 : 3/2/2022

モデル概要

このモデルは主に画像分類タスクに使用され、入力画像をImageNet 22kのクラスのいずれかに分類できます。

モデル特徴

純粋な畳み込みアーキテクチャ
純粋な畳み込みネットワーク設計を採用し、Transformerの計算複雑さを回避しています
モダンな改良
ResNetアーキテクチャを基に、Swin Transformerの概念を取り入れてモダンな改良を施しています
高性能
視覚Transformerモデルを凌駕する性能を主張しています
大規模訓練
ImageNet-22kの大規模データセットで訓練されています

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
入力画像をImageNet 22kのクラスのいずれかに分類します
物体認識
画像中の物体カテゴリ(例:トラ、ティーポットなど)を識別します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase