M

Mambavision L2 1K

nvidiaによって開発
MambaVisionはMambaとTransformerの利点を融合した初のコンピュータビジョンハイブリッドモデルで、Mambaの式を再構築して視覚的特徴モデリング能力を強化し、Mambaアーキテクチャの最後の数層にセルフアテンションモジュールを追加して長距離空間依存関係のモデリング能力を向上させています。
ダウンロード数 56
リリース時間 : 7/14/2024

モデル概要

MambaVisionはMambaとTransformerの利点を組み合わせたハイブリッド型視覚バックボーンネットワークで、主に画像分類と特徴抽出タスクに使用されます。

モデル特徴

ハイブリッドアーキテクチャ
Mambaの効率的なシーケンスモデリング能力とTransformerの長距離依存関係モデリング能力を組み合わせ、視覚的特徴抽出効果を向上させます。
階層型アーキテクチャ
階層型アーキテクチャ設計を採用し、さまざまな計算リソースと性能要件に対応するアプリケーションシナリオを満たします。
高性能
Top-1精度と計算スループットの両方で新しいSOTAパレートフロンティアを確立しました。

モデル能力

画像分類
特徴抽出

使用事例

コンピュータビジョン
画像分類
入力画像を分類し、クラスラベルを出力します。
ImageNet-1Kデータセットで高い精度を達成しました。
特徴抽出
画像の階層的特徴を抽出し、物体検出や画像セグメンテーションなどの下流タスクに使用できます。
4段階の階層的特徴と最終的な平均プーリング後の平坦化された特徴の抽出をサポートします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase