C

Convnext Base 384

facebookによって開発
ConvNeXTは純粋な畳み込みモデルで、ビジュアルTransformerの設計に触発され、ImageNet - 1kデータセットで384x384の解像度で訓練され、Transformerを上回る性能を持つと主張されています。
ダウンロード数 61
リリース時間 : 3/2/2022

モデル概要

ConvNeXTは、主に画像分類タスクに使用される最新の畳み込みネットワークモデルです。ResNetをベースに、Swin Transformerの設計理念を借りて、従来の畳み込みネットワークの性能を最適化しています。

モデル特徴

最新の畳み込み設計
ResNetアーキテクチャに基づき、Transformerの設計理念を借りて、従来の畳み込みネットワークの性能を最適化しています。
高性能
ImageNet - 1kデータセットで優れた性能を発揮し、Transformerモデルを上回る性能を持つと主張されています。
高解像度訓練
モデルは384x384の解像度で訓練されており、高解像度の画像を処理するのに適しています。

モデル能力

画像分類
ビジュアル特徴抽出

使用事例

コンピュータビジョン
ImageNet分類
画像を1000のImageNetカテゴリの1つに分類する
高い精度の分類結果
物体認識
画像内の主要な物体を認識する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase