Mask2former Swin Small Cityscapes Panoptic
基於Swin骨幹網絡的小型Mask2Former模型,專為Cityscapes數據集的全景分割任務優化
Downloads 568
Release Time : 1/3/2023
Model Overview
Mask2Former是一種通用圖像分割框架,通過預測一組掩碼及對應標籤統一處理實例分割、語義分割和全景分割任務。該特定檢查點針對城市街景全景分割進行了微調。
Model Features
統一分割框架
將實例分割、語義分割和全景分割統一為掩碼預測任務,簡化處理流程
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器,提升計算效率
掩碼注意力解碼器
創新性引入帶掩碼注意力的Transformer解碼器,在不增加計算量的情況下提升性能
高效訓練策略
通過子採樣點計算損失而非整張掩碼,顯著減少訓練時的計算資源消耗
Model Capabilities
圖像分割
街景理解
物體識別與定位
全景分割
Use Cases
智能交通系統
街景要素分析
對城市道路中的車輛、行人、交通標誌等進行精確分割和分類
可用於交通流量監控和城市規劃
自動駕駛
環境感知
即時識別和分割道路場景中的各類物體
為自動駕駛系統提供精確的環境理解
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98