S

Swin Base Patch4 Window7 224

microsoftによって開発
Swin Transformerは、移動ウィンドウに基づく階層型ビジュアルTransformerで、画像分類タスクに適しています。
ダウンロード数 281.49k
リリース時間 : 3/2/2022

モデル概要

このモデルは、ImageNet - 1kデータセットで224x224の解像度で訓練され、階層型特徴マップと局所ウィンドウ自己アテンション機構を採用しており、計算複雑度は入力画像のサイズに対して線形関係にあります。

モデル特徴

階層型特徴マップ
画像パッチを結合して階層型特徴マップを構築し、さまざまなスケールのビジュアルタスクに適しています。
局所ウィンドウ自己アテンション
局所ウィンドウ内でのみ自己アテンションを計算し、計算複雑度は入力画像のサイズに対して線形関係にあります。
汎用バックボーンネットワーク
画像分類と密集認識タスクの汎用バックボーンネットワークとして使用できます。

モデル能力

画像分類
ビジュアル特徴抽出

使用事例

コンピュータビジョン
画像分類
画像をImageNetの1,000のカテゴリの1つに分類します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase