M

Mit B4

由nvidia開發
基於ImageNet-1k微調的SegFormer編碼器,採用分層式Transformer架構,適用於語義分割任務
下載量 3,573
發布時間 : 3/2/2022

模型概述

SegFormer是一個基於Transformer的語義分割模型,採用分層式編碼器和輕量級全MLP解碼頭設計。本版本僅包含預訓練的編碼器部分,可用於下游任務的微調。

模型特點

分層Transformer架構
採用分層式Transformer編碼器,能有效捕獲多尺度特徵
輕量級設計
結合輕量級全MLP解碼頭,在保持性能的同時降低計算複雜度
預訓練編碼器
提供在ImageNet-1k上預訓練的編碼器,便於下游任務微調

模型能力

圖像語義分割
多尺度特徵提取

使用案例

計算機視覺
場景理解
用於ADE20K等場景解析數據集的語義分割
在ADE20K和Cityscapes等基準測試中表現優異
物體識別
識別和分割圖像中的特定物體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase