D

Deit Small Patch16 224

facebookによって開発
DeiTはより効率的にトレーニング可能なVision Transformerモデルで、ImageNet-1kデータセットで224x224解像度で事前学習とファインチューニングが行われ、画像分類タスクに適しています。
ダウンロード数 24.53k
リリース時間 : 3/2/2022

モデル概要

このモデルはTransformerアーキテクチャに基づく画像分類モデルで、アテンションメカニズムを通じてデータ効率的なトレーニングを実現し、主に1000クラスのImageNet画像分類タスクに使用されます。

モデル特徴

データ効率的なトレーニング
アテンションメカニズムにより、従来のViTよりも効率的なトレーニングを実現し、データ要件を削減
小型モデル
ベースモデルと比較してパラメータ数が少ない(22M)、リソースが限られた環境に適している
高精度
ImageNet-1kで79.9%のtop-1精度を達成

モデル能力

画像分類
特徴抽出

使用事例

コンピュータビジョン
画像分類
画像を1000のImageNetカテゴリのいずれかに分類
79.9% top-1精度
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase