M

Mask2former Swin Base IN21k Coco Instance

facebookによって開発
Mask2FormerはTransformerベースの汎用画像セグメンテーションモデルで、COCOデータセットでインスタンスセグメンテーションタスク向けにファインチューニングされています
ダウンロード数 26
リリース時間 : 1/16/2023

モデル概要

統一アーキテクチャを採用し、インスタンス/セマンティック/パノプティックセグメンテーションタスクを処理、マスクグループと対応するラベルを予測することで高性能なセグメンテーションを実現

モデル特徴

統一セグメンテーションアーキテクチャ
同じモデルアーキテクチャを使用してインスタンス/セマンティック/パノプティックの3種類のセグメンテーションタスクを処理
マスクアテンションメカニズム
革新的なマスクアテンションTransformerデコーダーにより、計算量を増やさずに性能を向上
効率的なトレーニング戦略
マスク全体ではなくサンプルポイントで損失を計算することで、トレーニング効率を大幅に向上

モデル能力

画像インスタンスセグメンテーション
マルチオブジェクト認識とセグメンテーション
複雑なシーン解析

使用事例

コンピュータビジョン
物体インスタンスセグメンテーション
画像内の各物体インスタンスを正確にセグメンテーション
COCOデータセットで先進的な性能を達成
シーン理解
複雑なシーン内の物体とその空間関係を解析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase