# 画像分類バックボーン

Dinov2 With Registers Small Imagenet1k 1 Layer
Apache-2.0
DINOv2でトレーニングされた視覚Transformerモデルで、レジスタトークンを追加することでアテンションメカニズムを改善し、アーティファクトを除去して性能を向上
画像分類 Transformers
D
facebook
445
2
Regnety 320.seer
その他
RegNetY-32GF特徴抽出モデル、SEER手法で20億枚のランダムウェブ画像で事前学習済み、画像分類と特徴抽出タスクに適応
画像分類 Transformers
R
timm
19
0
Focalnet Huge Fl4.ms In22k
MIT
FocalNetは焦点変調ネットワークに基づく画像分類モデルで、マイクロソフトチームによってImageNet-22kデータセットで事前学習されました。
画像分類 Transformers
F
timm
103
0
Convnextv2 Base.fcmae
ConvNeXt-V2ベースの自己教師あり特徴表現モデルで、全畳み込みマスク自己エンコーダーフレームワーク(FCMAE)を使用して事前学習
画像分類 Transformers
C
timm
629
1
Convnextv2 Atto.fcmae
ConvNeXt-V2ベースの自己教師あり特徴表現モデルで、全畳み込みマスク自己符号化器フレームワーク(FCMAE)を使用して事前学習されており、画像分類や特徴抽出タスクに適しています。
画像分類 Transformers
C
timm
485
0
Swinv2 Base Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2は、階層的特徴マップと局所ウィンドウ自己注意メカニズムにより、効率的な画像分類と密な認識タスクを実現する視覚Transformerモデルです。
画像分類 Transformers
S
microsoft
1,824
0
Swinv2 Base Patch4 Window12 192 22k
Apache-2.0
Swin Transformer v2は、階層的特徴マップと局所ウィンドウ自己注意メカニズムにより効率的な画像処理を実現する視覚Transformerモデルです。
画像分類 Transformers
S
microsoft
8,603
3
Swinv2 Small Patch4 Window16 256
Apache-2.0
Swin Transformer v2 は階層的特徴マップと局所ウィンドウ自己注意機構により効率的な画像処理を実現する視覚Transformerモデルです。
画像分類 Transformers
S
microsoft
315
1
Swinv2 Tiny Patch4 Window16 256
Apache-2.0
Swin Transformer v2は、階層的特徴マップと局所ウィンドウ自己注意機構により効率的な画像分類を実現する視覚トランスフォーマーモデルです。
画像分類 Transformers
S
microsoft
403.69k
5
Swin Base Patch4 Window12 384
Apache-2.0
Swin Transformerは、シフトウィンドウに基づく階層型視覚Transformerで、画像分類タスク向けに設計されており、計算複雑度が入力画像サイズに対して線形関係にあります。
画像分類 Transformers
S
microsoft
1,421
4
Swin Tiny Patch4 Window7 224
Apache-2.0
Swin Transformerは階層型ビジュアルTransformerで、局所ウィンドウを使って自己アテンションを計算することで線形計算複雑度を実現し、画像分類タスクに適しています。
画像分類 Transformers
S
microsoft
98.00k
42
Swin Base Patch4 Window7 224
Apache-2.0
Swin Transformerは、移動ウィンドウに基づく階層型ビジュアルTransformerで、画像分類タスクに適しています。
画像分類 Transformers
S
microsoft
281.49k
15
Swin Large Patch4 Window7 224
Apache-2.0
Swin Transformerは階層型ビジュアルTransformerで、局所ウィンドウを使って自己アテンションを計算することで線形計算複雑度を実現し、画像分類や密集認識タスクに適しています。
画像分類 Transformers
S
microsoft
2,079
1
Swin Large Patch4 Window7 224 In22k
Apache-2.0
Swin Transformerは移動ウィンドウに基づく階層型視覚Transformerで、ImageNet-21kデータセットで事前学習されており、画像分類タスクに適しています。
画像分類 Transformers
S
microsoft
387
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase