M

Mit B1

由nvidia開發
SegFormer是一個基於Transformer架構的語義分割模型,採用分層編碼器和輕量級MLP解碼頭設計。
下載量 7,305
發布時間 : 3/2/2022

模型概述

該模型是SegFormer的預訓練編碼器部分,基於ImageNet-1k微調,適用於語義分割任務的遷移學習。

模型特點

分層Transformer架構
採用多尺度特徵提取的分層設計,能有效捕捉不同層次的視覺特徵
輕量級MLP解碼頭
相比傳統卷積解碼器,計算效率更高且參數量更少
ImageNet預訓練
編碼器在ImageNet-1k上預訓練,具有強大的特徵提取能力

模型能力

圖像語義分割
視覺特徵提取
遷移學習

使用案例

計算機視覺
場景理解
對室內外場景進行像素級語義分割
在ADE20K和Cityscapes等基準測試表現優異
自動駕駛
道路場景解析和物體識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase