M

Mask2former Swin Large Cityscapes Semantic

facebookによって開発
Swinバックボーンネットワークを基にした大規模なMask2Formerモデルで、Cityscapesセマンティックセグメンテーションタスク向けにトレーニングされ、統一アーキテクチャで様々な画像セグメンテーションタスクを処理します。
ダウンロード数 296.33k
リリース時間 : 1/5/2023

モデル概要

Mask2Formerは、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションタスクを統一的に処理できる先進的な画像セグメンテーションモデルです。この特定のバージョンは都市景観のセマンティックセグメンテーション向けに最適化されています。

モデル特徴

統一セグメンテーションアーキテクチャ
一連のマスクとそれに対応するラベルを予測することで、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションタスクを統一的に処理します。
改良されたアテンションメカニズム
マルチスケール変形可能アテンションTransformerとマスクアテンションメカニズムを採用し、計算量を増やすことなく性能を向上させます。
効率的なトレーニング戦略
ダウンサンプリングポイントで損失を計算することで、トレーニング効率を大幅に向上させます。

モデル能力

画像セマンティックセグメンテーション
街景画像分析
マルチカテゴリ物体認識

使用事例

インテリジェント交通システム
都市景観解析
道路、車両、歩行者などの都市景観要素を自動的に識別・セグメンテーション
交通流量分析、自動運転の環境認識などのアプリケーションに利用可能
地理情報システム
衛星画像分析
衛星または航空画像に対してセマンティックセグメンテーションを実施
都市計画、土地利用分類などのシナリオに利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase