M

Mambavision B 21K

由nvidia開發
首個融合曼巴(Mamba)與Transformer優勢的計算機視覺混合模型,通過重構曼巴公式增強視覺特徵建模效率,並在曼巴架構末端引入自注意力模塊提升長程空間依賴建模能力。
下載量 1,395
發布時間 : 3/24/2025

模型概述

MambaVision是一個具有層級結構的視覺骨幹網絡,結合了曼巴和Transformer的優勢,適用於圖像分類和特徵提取任務。

模型特點

混合架構創新
首次將曼巴與Transformer結合,重構曼巴公式以優化視覺特徵建模效率
層級結構設計
提供具有層級結構的模型系列,滿足多樣化設計需求
性能優化
在曼巴架構末端引入自注意力模塊,顯著提升長程空間依賴建模能力

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
圖像分類
對輸入圖像進行分類預測
在ImageNet-1K上達到84.9% Top-1準確率
特徵提取
獲取圖像的四階段特徵圖及全局平均池化特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase