M

Mask2former Swin Large Ade Panoptic

facebookによって開発
Swin大型バックボーンネットワークを基にADE20kパノプティックセグメンテーションデータセットで訓練されたMask2Formerモデルで、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションのタスクを統一的なパラダイムで処理します。
ダウンロード数 2,625
リリース時間 : 1/5/2023

モデル概要

Mask2Formerは汎用的な画像セグメンテーションモデルで、一連のマスクと対応するラベルを予測することで、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションの3つの主要タスクをインスタンスセグメンテーション問題として統一します。

モデル特徴

統一セグメンテーションパラダイム
一連のマスクと対応するラベルを予測することで、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションの3つの主要タスクをインスタンスセグメンテーション問題として統一します。
マルチスケール変形可能アテンション
マルチスケール変形可能アテンションTransformerを使用してピクセルデコーダーをアップグレードし、モデルの性能を向上させます。
マスクアテンションメカニズム
マスクアテンションメカニズムを導入したTransformerデコーダーにより、計算量を増やすことなく性能を向上させます。
効率的な訓練
サブサンプリングポイントを使用して損失を計算することで、訓練効率を大幅に向上させます。

モデル能力

画像セグメンテーション
インスタンスセグメンテーション
セマンティックセグメンテーション
パノプティックセグメンテーション

使用事例

コンピュータビジョン
シーン理解
複雑なシーン内の物体とその関係を理解するために使用されます
自動運転
道路シーンの物体認識とセグメンテーションに使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase