Mask2former Swin Base IN21k Cityscapes Instance
Mask2Former是基于Transformer的通用图像分割模型,统一处理实例、语义和全景分割任务。
Downloads 53
Release Time : 1/5/2023
Model Overview
该模型通过预测一组掩码及对应标签实现实例分割,采用Swin Transformer骨干网络并在Cityscapes数据集上微调。
Model Features
统一分割架构
将实例、语义和全景分割统一为掩码预测问题
高效注意力机制
采用多尺度可变形注意力和掩码注意力提升计算效率
训练优化
通过子采样点计算损失而非整张掩码,提高训练效率
Model Capabilities
图像实例分割
多尺度特征提取
高效掩码预测
Use Cases
计算机视觉
街景分析
对Cityscapes等街景数据集中的物体进行实例分割
可准确识别和分割道路、车辆、行人等对象
物体识别
识别和分割图像中的特定物体实例
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98