M

Mambavision B 21K

nvidiaによって開発
マンバ(Mamba)とTransformerの利点を融合した初のコンピュータビジョンハイブリッドモデルで、マンバ式を再構築して視覚特徴モデリングの効率を向上させ、マンバアーキテクチャの末端に自己注意モジュールを導入して長距離空間依存関係のモデリング能力を強化しました。
ダウンロード数 1,395
リリース時間 : 3/24/2025

モデル概要

MambaVisionは階層構造を持つ視覚バックボーンネットワークで、マンバとTransformerの利点を組み合わせ、画像分類や特徴抽出タスクに適しています。

モデル特徴

ハイブリッドアーキテクチャの革新
初めてマンバとTransformerを組み合わせ、マンバ式を再構築して視覚特徴モデリングの効率を最適化
階層構造設計
多様な設計ニーズに対応する階層構造を持つモデルシリーズを提供
性能最適化
マンバアーキテクチャの末端に自己注意モジュールを導入し、長距離空間依存関係のモデリング能力を大幅に向上

モデル能力

画像分類
視覚特徴抽出

使用事例

コンピュータビジョン
画像分類
入力画像を分類予測
ImageNet-1Kで84.9%のTop-1精度を達成
特徴抽出
画像の4段階特徴マップとグローバル平均プーリング特徴を取得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase