M

Mit B3

Developed by nvidia
基於ImageNet-1k微調的SegFormer編碼器,採用分層Transformer架構,適用於語義分割任務。
Downloads 7,136
Release Time : 3/2/2022

Model Overview

SegFormer是一種基於Transformer的語義分割模型,具有簡潔高效的設計。本模型僅包含預訓練的分層Transformer編碼器,可用於下游任務微調。

Model Features

分層Transformer架構
採用分層Transformer編碼器,能夠有效處理不同尺度的視覺特徵。
輕量級MLP解碼頭
配合輕量級全MLP解碼頭架構,在保持性能的同時減少計算複雜度。
ImageNet-1k預訓練
編碼器已在ImageNet-1k數據集上進行預訓練,具備良好的特徵提取能力。

Model Capabilities

圖像特徵提取
語義分割
視覺任務微調

Use Cases

計算機視覺
場景理解
可用於ADE20K等場景理解數據集的語義分割任務。
城市景觀分析
適用於Cityscapes等城市景觀數據集的語義分割。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase