M

Mit B3

由nvidia開發
基於ImageNet-1k微調的SegFormer編碼器,採用分層Transformer架構,適用於語義分割任務。
下載量 7,136
發布時間 : 3/2/2022

模型概述

SegFormer是一種基於Transformer的語義分割模型,具有簡潔高效的設計。本模型僅包含預訓練的分層Transformer編碼器,可用於下游任務微調。

模型特點

分層Transformer架構
採用分層Transformer編碼器,能夠有效處理不同尺度的視覺特徵。
輕量級MLP解碼頭
配合輕量級全MLP解碼頭架構,在保持性能的同時減少計算複雜度。
ImageNet-1k預訓練
編碼器已在ImageNet-1k數據集上進行預訓練,具備良好的特徵提取能力。

模型能力

圖像特徵提取
語義分割
視覺任務微調

使用案例

計算機視覺
場景理解
可用於ADE20K等場景理解數據集的語義分割任務。
城市景觀分析
適用於Cityscapes等城市景觀數據集的語義分割。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase