D

Dinat Mini In1k 224

由shi-labs開發
DiNAT-Mini是基於鄰域注意力機制的分層視覺Transformer模型,專為圖像分類任務設計。
下載量 462
發布時間 : 11/14/2022

模型概述

該模型採用擴張鄰域注意力機制(DiNA),在ImageNet-1K數據集上訓練完成,適用於224x224分辨率的圖像分類任務。

模型特點

鄰域注意力機制
採用受限的自注意力機制,每個標記的感受野僅限於其最近的相鄰像素,保持平移等變性。
擴張鄰域注意力
通過擴張變體(DiNA)擴展感受野,形成靈活的滑動窗口注意力模式。
分層結構
採用分層視覺Transformer架構,適合處理不同尺度的視覺特徵。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
ImageNet圖像分類
將輸入圖像分類為1000個ImageNet類別之一
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase