S

Swin Base Patch4 Window12 384

Developed by microsoft
Swin Transformer是一种基于移位窗口的分层视觉Transformer,专为图像分类任务设计,计算复杂度与输入图像大小呈线性关系。
Downloads 1,421
Release Time : 3/2/2022

Model Overview

该模型在ImageNet-1k数据集上以384x384分辨率训练而成,可作为图像分类和密集识别任务的通用骨干网络。

Model Features

分层特征图
通过在深层合并图像块构建分层特征图,增强模型对不同尺度特征的捕捉能力。
局部窗口自注意力
仅在局部窗口内计算自注意力,使计算复杂度与输入图像大小呈线性关系,提高计算效率。
移位窗口机制
采用移位窗口设计,允许跨窗口信息交互,同时保持计算效率。

Model Capabilities

图像分类
视觉特征提取

Use Cases

计算机视觉
ImageNet图像分类
将输入图像分类为1000个ImageNet类别之一。
密集识别任务
作为骨干网络支持目标检测、语义分割等密集识别任务。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase