M

Mask2former Swin Small Cityscapes Instance

facebookによって開発
Mask2FormerはTransformerベースの統一画像セグメンテーションモデルで、マスクアテンションメカニズムにより性能を向上
ダウンロード数 43
リリース時間 : 1/5/2023

モデル概要

このモデルはMask2Formerの小型バージョンで、Swin Transformerをバックボーンネットワークとして使用し、Cityscapesデータセット向けにインスタンスセグメンテーションタスク用にファインチューニングされています。インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションタスクを処理する統一アーキテクチャを採用しています。

モデル特徴

統一セグメンテーションアーキテクチャ
インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションタスクを処理する統一パラダイムを採用
マスクアテンションメカニズム
マスク付きアテンションを備えたTransformerデコーダーを導入し、計算量を増やすことなく性能を向上
効率的なトレーニング戦略
マスク全体ではなくサンプリングポイントで損失を計算することで、トレーニング効率を大幅に向上

モデル能力

画像インスタンスセグメンテーション
マルチスケール特徴抽出
高精度な物体境界認識

使用事例

自動運転
街路物体認識
都市景観中の車両、歩行者などのインスタンスを識別
Cityscapesデータセットで優れたパフォーマンス
インテリジェント監視
シーン分析
監視映像中の物体を正確にセグメンテーションし識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase