M

Mambavision T 1K

nvidiaによって開発
MambaVisionは、MambaとTransformerの利点を組み合わせた初のコンピュータビジョンハイブリッドモデルで、Mambaの式を再設計しViTモジュールを統合することで、長距離空間依存関係のモデリング能力を大幅に向上させました。
ダウンロード数 2,323
リリース時間 : 7/14/2024

モデル概要

MambaVisionは、画像分類と特徴抽出タスクのために設計されたハイブリッドMamba-Transformer視覚バックボーンネットワークです。Mambaの効率的なモデリング能力とTransformerの長距離依存性捕捉能力を組み合わせ、Top-1精度とスループットの両方で新しいSOTAレベルを達成しました。

モデル特徴

ハイブリッドアーキテクチャの革新
初めてMambaとTransformerの利点を組み合わせ、視覚特徴モデリング能力を強化するためにMambaの式を再設計
階層的設計
さまざまな設計ニーズに対応する階層的アーキテクチャを持つ一連のモデルを提供
効率的な長距離依存性モデリング
Mambaアーキテクチャの最終層に複数の自己注意モジュールを追加し、長距離空間依存関係の捕捉能力を大幅に向上

モデル能力

画像分類
画像特徴抽出
多段階特徴出力

使用事例

コンピュータビジョン
画像分類
入力画像を分類識別する(例:動物の種類を識別)
例ではヒグマを正しく識別
特徴抽出
画像の多層的特徴表現を抽出し、下流タスクに利用可能
4段階の特徴マップと平均プーリング特徴を出力可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase