M

Mambavision T2 1K

nvidiaによって開発
MambaとTransformerの利点を組み合わせた初のコンピュータビジョンハイブリッドモデルで、Mambaの式を再設計して視覚特徴モデリング能力を強化し、Mambaアーキテクチャにセルフアテンションモジュールを組み込むことで長距離空間依存関係のモデリングを向上させています。
ダウンロード数 597
リリース時間 : 7/14/2024

モデル概要

MambaVisionはMambaとTransformerを組み合わせたハイブリッド視覚モデルで、画像特徴抽出と分類のために設計されており、効率的な視覚特徴モデリング能力と優れた性能を発揮します。

モデル特徴

ハイブリッドアーキテクチャ設計
Mambaの効率的なモデリング能力とTransformerの長距離依存関係モデリングの利点を組み合わせ、より優れた視覚特徴抽出を実現します。
階層型アーキテクチャ
多様な視覚タスクのニーズに対応する階層型アーキテクチャを提供し、さまざまな規模と複雑さのアプリケーションシナリオをサポートします。
高性能
Top-1精度とスループットの両方で新しいSOTAパレートフロンティアを達成し、優れた性能を発揮します。

モデル能力

画像特徴抽出
画像分類

使用事例

コンピュータビジョン
画像分類
入力画像を分類します。例えば、COCOデータセット内の物体認識など。
画像内の物体カテゴリ(ヒグマなど)を正確に識別します。
特徴抽出
物体検出や画像セグメンテーションなどの下流タスクに使用するための多段階の画像特徴を抽出します。
4段階の特徴と最終的な平均プーリング特徴を出力し、さまざまな視覚タスクに適用可能です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase