M

Mambavision L3 512 21K

由nvidia開發
MambaVision是首個結合曼巴(Mamba)與Transformer優勢的計算機視覺混合模型,通過重新設計曼巴公式增強視覺特徵建模能力,並在曼巴架構最後幾層加入自注意力模塊提升長距離空間依賴建模能力。
下載量 7,548
發布時間 : 3/24/2025

模型概述

MambaVision系列模型是專為計算機視覺任務設計的混合架構,結合了曼巴(Mamba)的高效序列建模能力和Transformer的自注意力機制,適用於圖像分類和特徵提取等任務。

模型特點

混合架構設計
結合曼巴(Mamba)的高效序列建模能力和Transformer的自注意力機制,在曼巴架構最後幾層加入自注意力模塊以提升長距離空間依賴建模能力。
層級結構
提供具有層級結構的模型系列,包括不同規模的模型以滿足不同計算資源和性能需求。
高性能
在Top1準確率與吞吐量方面實現了新的SOTA帕累託前沿,平衡了模型性能和計算效率。

模型能力

圖像分類
特徵提取

使用案例

計算機視覺
圖像分類
使用MambaVision對圖像進行分類,如識別動物種類、物體類別等。
在ImageNet-1K上達到88.1%的Top1準確率。
特徵提取
提取圖像的四階段特徵圖及全局池化特徵,可用於下游任務如目標檢測、圖像分割等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase