M

Mit B2

Developed by nvidia
SegFormer是一個基於Transformer的語義分割模型,其編碼器在Imagenet-1k上進行了微調。
Downloads 13.86k
Release Time : 3/2/2022

Model Overview

SegFormer由分層Transformer編碼器和輕量級全MLP解碼頭組成,專注於語義分割任務。本版本僅包含預訓練的分層Transformer,可用於微調目的。

Model Features

分層Transformer架構
採用分層設計的Transformer編碼器,能有效處理不同尺度的視覺特徵
輕量級MLP解碼頭
配合輕量級全MLP解碼頭,在保持高效的同時實現優異的語義分割性能
ImageNet預訓練
編碼器在ImageNet-1k數據集上進行了預訓練,提供良好的特徵提取基礎

Model Capabilities

圖像語義分割
視覺特徵提取
下游任務微調

Use Cases

計算機視覺
場景理解
對ADE20K等場景數據集進行語義分割
在ADE20K和Cityscapes等基準測試中表現優異
圖像分析
提取圖像中的物體和區域信息
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase