M

Mask2former Swin Small Cityscapes Semantic

facebookによって開発
Swinバックボーンネットワークに基づくMask2Formerの小型バージョン、Cityscapesセマンティックセグメンテーションタスク向けにトレーニング
ダウンロード数 952
リリース時間 : 1/5/2023

モデル概要

Mask2Formerは汎用的な画像セグメンテーションモデルで、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションを統一的なパラダイムで処理します。一連のマスクと対応するラベルを予測することでセグメンテーション機能を実現します。

モデル特徴

統一セグメンテーションパラダイム
インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションをインスタンスセグメンテーションタスクとして統一処理
効率的なアテンションメカニズム
従来のピクセルデコーダーをマルチスケール変形可能アテンションTransformerで置き換え
マスクアテンションデコーダー
マスクアテンション付きTransformerデコーダーを導入し、計算量を増やさずに性能向上
効率的なトレーニング方法
マスク全体ではなくサンプリングポイントで損失を計算し、トレーニング効率を大幅に向上

モデル能力

画像セマンティックセグメンテーション
多クラス物体認識
高精度マスク予測

使用事例

自動運転
街路景観セマンティックセグメンテーション
都市道路シーンをピクセルレベルで分類し、道路、車両、歩行者などの要素を識別
Cityscapesデータセットで優れた性能を発揮
リモートセンシング画像分析
地表被覆分類
衛星または航空画像の地表被覆タイプをセグメンテーション
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase