M

Mambavision L2 512 21K

nvidiaによって開発
マンバ(Mamba)とTransformerの利点を組み合わせた初のハイブリッドコンピュータビジョンモデルで、マンバの式を再構築して視覚的特徴モデリング能力を強化
ダウンロード数 2,678
リリース時間 : 3/24/2025

モデル概要

MambaVisionは、マンバとTransformerアーキテクチャの利点を組み合わせたハイブリッドコンピュータビジョンモデルで、特に視覚的特徴モデリング能力を最適化しています。このモデルはImageNet-21Kで事前学習され、512×512解像度でImageNet-1Kに対して微調整され、優れた画像分類性能を実現しました。

モデル特徴

ハイブリッドアーキテクチャの革新
初めてマンバ(Mamba)とTransformerアーキテクチャの利点を組み合わせ、マンバの式を再構築して視覚的特徴モデリング能力を強化
階層的アーキテクチャ設計
階層的アーキテクチャ設計を採用し、マンバアーキテクチャの最後の数層に自己注意モジュールを追加することで、長距離空間依存関係のモデリング能力を大幅に向上
高性能
Top-1精度とスループットの両方で新しいSOTAパレートフロンティアを達成し、87.3%のTop-1精度を実現

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
汎用画像分類
入力画像を分類し、画像内の主要な物体やシーンを識別
ImageNet-1Kで87.3%のTop-1精度を達成
視覚的特徴抽出
汎用特徴抽出器として、4段階の特徴マップと最終的な平均プーリング特徴を取得
異なるレベルの特徴表現を取得可能で、下流の視覚タスクに適応
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase