N

Nat Small In1k 224

由shi-labs開發
NAT-Small是基於鄰域注意力的分層視覺變換器,專為圖像分類任務設計
下載量 6
發布時間 : 11/18/2022

模型概述

NAT是一種基於鄰域注意力(NA)的分層視覺變換器,採用受限自注意力機制,每個標記的感受野僅限於其最近的相鄰像素,具有高度靈活性並保持平移等變性

模型特點

鄰域注意力機制
採用滑動窗口注意力模式,每個標記僅關注其最近鄰像素,保持計算效率的同時實現局部特徵提取
平移等變性
通過鄰域注意力設計,模型保持對圖像平移的等變特性
分層結構
採用分層視覺變換器架構,適合處理不同尺度的視覺特徵

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
ImageNet分類
將圖像分類為ImageNet的1,000個類別
物體識別
識別圖像中的主要物體類別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase