Mask2former Swin Large Mapillary Vistas Semantic
基於Swin骨幹網絡的大規模Mask2Former模型,專為通用圖像分割任務設計,統一處理實例分割、語義分割和全景分割。
Downloads 5,539
Release Time : 1/5/2023
Model Overview
Mask2Former是一種先進的圖像分割模型,通過預測一組掩碼及其對應標籤,以統一方式解決實例分割、語義分割和全景分割任務。相比前代模型,它在性能和效率上均有顯著提升。
Model Features
統一分割框架
將實例分割、語義分割和全景分割統一為掩碼預測問題,簡化了任務處理流程。
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器,提高了計算效率。
掩碼注意力解碼器
引入帶掩碼注意力的Transformer解碼器,在不增加計算量的情況下提升性能。
高效訓練策略
通過基於採樣點而非完整掩碼計算損失,顯著提高了訓練效率。
Model Capabilities
語義分割
實例分割
全景分割
圖像理解
場景解析
Use Cases
自動駕駛
道路場景理解
識別和分割道路場景中的各種元素(車輛、行人、交通標誌等)
提供精確的場景元素分割結果,支持自動駕駛決策
遙感圖像分析
地物分類
對衛星或航拍圖像中的不同地物類型進行分割和分類
準確識別和分割各類地物,支持土地利用分析
醫學影像
器官分割
在醫學影像中分割特定器官或病變區域
提供精確的器官邊界識別,輔助診斷和治療
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98