M

Mit B5

由 nvidia 开发
SegFormer是一个基于Transformer的语义分割模型,本版本仅包含在Imagenet-1k上预训练的编码器部分。
下载量 15.94k
发布时间 : 3/2/2022

模型简介

SegFormer由分层Transformer编码器和轻量级全MLP解码头组成,本模型仅包含预训练的分层Transformer编码器,可用于语义分割任务的微调。

模型特点

分层Transformer架构
采用分层Transformer设计,能够高效处理不同尺度的图像特征
轻量级设计
模型设计简洁高效,在保持性能的同时减少计算资源需求
预训练编码器
提供在ImageNet-1k上预训练的编码器,便于下游任务微调

模型能力

图像分类
语义分割(需微调)
特征提取

使用案例

计算机视觉
语义分割
可用于场景理解、自动驾驶等需要像素级分类的任务
在ADE20K和Cityscapes等基准测试中表现优异
图像分类
可直接用于1000类ImageNet图像分类任务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase