M

Mit B0

由nvidia開發
SegFormer是一個基於Transformer的語義分割模型,採用分層編碼器和輕量級MLP解碼頭設計,在ADE20K和Cityscapes等基準測試中表現優異。
下載量 83.99k
發布時間 : 3/2/2022

模型概述

該模型是SegFormer的分層Transformer編碼器部分,基於ImageNet-1k預訓練,可用於下游語義分割任務的微調。

模型特點

分層Transformer架構
採用分層設計的Transformer編碼器,能有效捕獲多尺度特徵
輕量級MLP解碼頭
配合輕量級全MLP解碼頭,實現高效的語義分割
ImageNet預訓練
編碼器在ImageNet-1k數據集上預訓練,具有強大的特徵提取能力

模型能力

圖像特徵提取
語義分割任務微調

使用案例

計算機視覺
場景理解
用於ADE20K等場景解析數據集的語義分割
城市場景分析
在Cityscapes數據集上進行道路、建築物等城市場景元素的分割
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase