M

Mambavision S 1K

由nvidia開發
首個結合曼巴(Mamba)與Transformer優勢的計算機視覺混合模型,通過重構曼巴公式增強視覺特徵建模效率,並在曼巴架構末端加入自注意力模塊提升長程空間依賴建模能力。
下載量 908
發布時間 : 7/14/2024

模型概述

MambaVision是一個結合曼巴和Transformer優勢的視覺骨幹網絡,主要用於圖像分類和特徵提取任務,具有高效的視覺特徵建模能力和長程空間依賴處理能力。

模型特點

混合架構
結合曼巴(Mamba)與Transformer的優勢,重構曼巴公式以增強視覺特徵建模效率。
長程空間依賴建模
在曼巴架構末端加入自注意力模塊,顯著提升長程空間依賴的建模能力。
分層架構
提供具有分層架構的MambaVision系列模型,滿足多樣化設計需求。
高性能
在Top-1準確率與吞吐量方面實現了新的SOTA帕累託前沿。

模型能力

圖像分類
特徵提取
多階段特徵輸出

使用案例

計算機視覺
圖像分類
使用MambaVision對圖像進行分類,如識別動物種類等。
預測類別: 棕熊(brown bear, bruin, Ursus arctos)
特徵提取
使用MambaVision作為通用特徵提取器,獲取四階段層級特徵及最終平均池化特徵。
可獲取四個階段的特徵圖及平均池化特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase