# 階層型ビジョントランスフォーマー

Hiera Huge 224 Hf
Hieraは効率的な階層型ビジョントランスフォーマーモデルで、画像・動画タスクにおいて優れた性能と高速処理を実現
画像分類 Transformers 英語
H
facebook
41
1
Hiera Base Plus 224 Hf
Hieraは階層型ビジョントランスフォーマーモデルで、高速・強力・シンプルな特性を兼ね備え、幅広い画像・動画タスクにおいて既存技術を凌駕するとともに、実行速度を大幅に向上させます。
画像分類 Transformers 英語
H
facebook
15
0
Hiera Base 224 In1k Hf
Hieraは階層型ビジョントランスフォーマーモデルで、高速かつ強力でシンプルな特徴を持ち、幅広い画像・動画タスクで既存技術を凌駕する性能を発揮しながら、処理速度も大幅に向上させています。
画像分類 Transformers 英語
H
facebook
188
2
Hiera Small 224 Hf
Hieraは階層型ビジョントランスフォーマーモデルで、高速性、強力な機能、ミニマリストな設計を兼ね備え、画像・動画タスクにおいて既存技術を大幅に上回る性能と計算効率を発揮
画像分類 Transformers 英語
H
facebook
23
0
Upernet Swin Large
MIT
UperNetはセマンティックセグメンテーションのためのフレームワークで、Swin Transformerバックボーンと組み合わせてピクセルレベルのシーン理解を実現
画像セグメンテーション Transformers 英語
U
openmmlab
3,251
0
Nat Small In1k 224
MIT
NAT-Smallは近隣注意に基づく階層型ビジョントランスフォーマーで、画像分類タスク向けに設計されています
画像分類 Transformers その他
N
shi-labs
6
0
Dinat Mini In1k 224
MIT
DiNAT-Miniは近傍アテンション機構に基づく階層型ビジョントランスフォーマーモデルで、画像分類タスク向けに設計されています。
画像分類 Transformers
D
shi-labs
462
1
Swinv2 Large Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2はImageNet-21kで事前学習され、384x384解像度でImageNet-1kに対してファインチューニングされたビジョントランスフォーマーモデルで、階層的特徴マップと局所ウィンドウ自己注意機構を備えています。
画像分類 Transformers
S
microsoft
3,048
4
Swinv2 Large Patch4 Window12to16 192to256 22kto1k Ft
Apache-2.0
Swin Transformer v2は、階層的特徴マップとローカルウィンドウ自己注意メカニズムにより、効率的な画像分類と密な認識タスクを実現するビジョントランスフォーマーモデルです。
画像分類 Transformers
S
microsoft
812
4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase