S

Swin Base Patch4 Window7 224

Developed by microsoft
Swin Transformer是一種基於移動窗口的分層視覺Transformer,適用於圖像分類任務。
Downloads 281.49k
Release Time : 3/2/2022

Model Overview

該模型在ImageNet-1k數據集上以224x224分辨率訓練而成,採用分層特徵圖和局部窗口自注意力機制,計算複雜度與輸入圖像大小呈線性關係。

Model Features

分層特徵圖
通過合併圖像塊構建分層特徵圖,適用於不同尺度的視覺任務。
局部窗口自注意力
僅在局部窗口內計算自注意力,計算複雜度與輸入圖像大小呈線性關係。
通用骨幹網絡
可作為圖像分類和密集識別任務的通用骨幹網絡。

Model Capabilities

圖像分類
視覺特徵提取

Use Cases

計算機視覺
圖像分類
將圖像分類為ImageNet的1,000個類別之一。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase