M

Mambavision L 1K

由nvidia開發
首個結合Mamba與Transformer優勢的計算機視覺混合模型,通過重新設計Mamba公式增強視覺特徵建模能力
下載量 1,542
發布時間 : 7/14/2024

模型概述

MambaVision是結合Mamba與Transformer的混合視覺模型,具有分層架構,支持圖像分類和特徵提取任務

模型特點

混合架構創新
首次將Mamba與Transformer結合,重新設計Mamba公式以增強視覺特徵建模能力
分層架構設計
提供分層架構模型系列,滿足不同設計需求
性能優勢
在Top-1準確率與吞吐量方面創造了新的SOTA帕累託前沿
多階段特徵提取
支持獲取四個階段的層級特徵及最終平均池化特徵

模型能力

圖像分類
視覺特徵提取
長距離空間依賴建模

使用案例

計算機視覺
通用圖像分類
對輸入圖像進行分類識別
示例輸出:'棕熊'
視覺特徵提取
提取圖像的多層次特徵表示
可獲取四個階段的層級特徵及平均池化特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase