S

Swin Tiny Patch4 Window7 224

microsoftによって開発
Swin Transformerは階層型ビジュアルTransformerで、局所ウィンドウを使って自己アテンションを計算することで線形計算複雑度を実現し、画像分類タスクに適しています。
ダウンロード数 98.00k
リリース時間 : 3/2/2022

モデル概要

このモデルはSwin Transformerアーキテクチャのミニバージョンで、ImageNet - 1kデータセットで学習され、画像分類タスクに使用されます。階層型設計とシフトウィンドウメカニズムを採用し、計算複雑度を効果的に低減しています。

モデル特徴

階層型設計
深層で画像パッチを結合することで階層型特徴マップを構築し、異なるスケールのビジュアル特徴を処理するのに適しています。
シフトウィンドウメカニズム
局所ウィンドウ内でのみ自己アテンションを計算することで、計算複雑度を入力画像サイズに対して線形にします。
高効率計算
従来のビジュアルTransformerと比較して、計算複雑度を大幅に低減しながら高性能を維持します。

モデル能力

画像分類
ビジュアル特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
入力画像を1000のImageNetカテゴリの1つに分類します。
ImageNet - 1kデータセットで良好な性能を達成します。
ビジュアル特徴抽出
バックボーンネットワークとして画像特徴を抽出し、下流のビジュアルタスクに使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase