M

Mit B2

由nvidia開發
SegFormer是一個基於Transformer的語義分割模型,其編碼器在Imagenet-1k上進行了微調。
下載量 13.86k
發布時間 : 3/2/2022

模型概述

SegFormer由分層Transformer編碼器和輕量級全MLP解碼頭組成,專注於語義分割任務。本版本僅包含預訓練的分層Transformer,可用於微調目的。

模型特點

分層Transformer架構
採用分層設計的Transformer編碼器,能有效處理不同尺度的視覺特徵
輕量級MLP解碼頭
配合輕量級全MLP解碼頭,在保持高效的同時實現優異的語義分割性能
ImageNet預訓練
編碼器在ImageNet-1k數據集上進行了預訓練,提供良好的特徵提取基礎

模型能力

圖像語義分割
視覺特徵提取
下游任務微調

使用案例

計算機視覺
場景理解
對ADE20K等場景數據集進行語義分割
在ADE20K和Cityscapes等基準測試中表現優異
圖像分析
提取圖像中的物體和區域信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase