M

Mit B0

Developed by nvidia
SegFormer是一個基於Transformer的語義分割模型,採用分層編碼器和輕量級MLP解碼頭設計,在ADE20K和Cityscapes等基準測試中表現優異。
Downloads 83.99k
Release Time : 3/2/2022

Model Overview

該模型是SegFormer的分層Transformer編碼器部分,基於ImageNet-1k預訓練,可用於下游語義分割任務的微調。

Model Features

分層Transformer架構
採用分層設計的Transformer編碼器,能有效捕獲多尺度特徵
輕量級MLP解碼頭
配合輕量級全MLP解碼頭,實現高效的語義分割
ImageNet預訓練
編碼器在ImageNet-1k數據集上預訓練,具有強大的特徵提取能力

Model Capabilities

圖像特徵提取
語義分割任務微調

Use Cases

計算機視覺
場景理解
用於ADE20K等場景解析數據集的語義分割
城市場景分析
在Cityscapes數據集上進行道路、建築物等城市場景元素的分割
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase