M

Mambavision T2 1K

由nvidia開發
首個結合Mamba與Transformer優勢的計算機視覺混合模型,通過重新設計Mamba公式增強視覺特徵建模能力,並在Mamba架構中融入自注意力模塊提升長程空間依賴建模。
下載量 597
發布時間 : 7/14/2024

模型概述

MambaVision是一個結合Mamba和Transformer的混合視覺模型,專為圖像特徵提取和分類設計,具有高效的視覺特徵建模能力和優異的性能表現。

模型特點

混合架構設計
結合Mamba的高效建模能力和Transformer的長程依賴建模優勢,實現更優的視覺特徵提取。
分層架構
提供分層架構設計,滿足多樣化視覺任務需求,支持不同規模和複雜度的應用場景。
高性能
在Top-1準確率與吞吐量方面實現了新的SOTA帕累託前沿,性能優異。

模型能力

圖像特徵提取
圖像分類

使用案例

計算機視覺
圖像分類
對輸入圖像進行分類,如COCO數據集中的物體識別。
準確識別圖像中的物體類別,如棕熊等。
特徵提取
提取圖像的多階段特徵,用於下游任務如目標檢測、圖像分割等。
輸出四個階段的特徵及最終平均池化特徵,適用於多種視覺任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase