M

Mambavision L3 512 21K

nvidiaによって開発
MambaVisionは、マンバ(Mamba)とTransformerの利点を組み合わせた初のコンピュータビジョンハイブリッドモデルです。再設計されたマンバ式により視覚特徴モデリング能力を強化し、マンバアーキテクチャの最後の数層にセルフアテンションモジュールを追加することで、長距離空間依存関係のモデリング能力を向上させています。
ダウンロード数 7,548
リリース時間 : 3/24/2025

モデル概要

MambaVisionシリーズは、コンピュータビジョンタスク向けに設計されたハイブリッドアーキテクチャで、マンバ(Mamba)の効率的なシーケンスモデリング能力とTransformerのセルフアテンションメカニズムを組み合わせており、画像分類や特徴抽出などのタスクに適しています。

モデル特徴

ハイブリッドアーキテクチャ設計
マンバ(Mamba)の効率的なシーケンスモデリング能力とTransformerのセルフアテンションメカニズムを組み合わせ、マンバアーキテクチャの最後の数層にセルフアテンションモジュールを追加することで、長距離空間依存関係のモデリング能力を向上させています。
階層構造
異なる計算リソースと性能要件に対応するため、さまざまな規模のモデルを含む階層構造を持つモデルシリーズを提供します。
高性能
Top1精度とスループットの両面で新しいSOTAパレートフロンティアを達成し、モデル性能と計算効率のバランスを実現しています。

モデル能力

画像分類
特徴抽出

使用事例

コンピュータビジョン
画像分類
MambaVisionを使用して画像を分類します。例えば、動物の種類や物体のカテゴリを識別します。
ImageNet-1Kで88.1%のTop1精度を達成。
特徴抽出
画像の4段階特徴マップとグローバルプーリング特徴を抽出し、物体検出や画像セグメンテーションなどの下流タスクに利用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase