M

Mit B5

由nvidia開發
SegFormer是一個基於Transformer的語義分割模型,本版本僅包含在Imagenet-1k上預訓練的編碼器部分。
下載量 15.94k
發布時間 : 3/2/2022

模型概述

SegFormer由分層Transformer編碼器和輕量級全MLP解碼頭組成,本模型僅包含預訓練的分層Transformer編碼器,可用於語義分割任務的微調。

模型特點

分層Transformer架構
採用分層Transformer設計,能夠高效處理不同尺度的圖像特徵
輕量級設計
模型設計簡潔高效,在保持性能的同時減少計算資源需求
預訓練編碼器
提供在ImageNet-1k上預訓練的編碼器,便於下游任務微調

模型能力

圖像分類
語義分割(需微調)
特徵提取

使用案例

計算機視覺
語義分割
可用於場景理解、自動駕駛等需要像素級分類的任務
在ADE20K和Cityscapes等基準測試中表現優異
圖像分類
可直接用於1000類ImageNet圖像分類任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase