maskformer-swin-small-ade开源语义分割模型 - 统一处理实例/语义/全景分割任务

首页

Maskformer Swin Small Ade

由 facebook 开发

基于ADE20k数据集训练的语义分割模型，采用统一框架处理实例/语义/全景分割任务

图像分割

Transformers

开源协议:其他 #语义分割 #Swin骨干网络 #掩码预测

下载量 205

发布时间 : 3/2/2022

模型简介

MaskFormer通过预测一组掩码及其对应标签，将分割任务统一为实例分割问题处理。当前检查点专用于语义分割任务。

模型特点

统一分割框架

将实例分割、语义分割和全景分割统一为实例分割问题处理

Swin骨干网络

采用高效的Swin Transformer作为特征提取骨干网络

掩码预测机制

通过预测一组二进制掩码及其对应类别实现分割任务

模型能力

图像语义分割

场景理解

物体边界识别

使用案例

场景解析

室内场景分析

识别室内环境中的墙壁、家具、电器等元素

生成像素级语义标签图

城市场景理解

分析街道场景中的建筑物、道路、车辆等要素

输出结构化场景分割结果

🚀 MaskFormer

MaskFormer是一个在ADE20k语义分割数据集上训练的模型（小尺寸版本，采用Swin骨干网络）。它在论文Per-Pixel Classification is Not All You Need for Semantic Segmentation中被提出，并首次在此仓库中发布。该模型使用同一范式处理实例分割、语义分割和全景分割任务，即通过预测一组掩码和相应的标签，将这3种任务都视为实例分割任务。

🚀 快速开始

你可以使用此特定的检查点进行语义分割。查看模型中心以查找针对你感兴趣的任务进行微调的其他版本。

✨ 主要特性

统一范式：MaskFormer使用同一范式处理实例分割、语义分割和全景分割任务，将这3种任务都视为实例分割任务。
模型架构：模型架构如图所示：

📦 安装指南

文档未提及安装步骤，故跳过此章节。

💻 使用示例

基础用法

from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests

url = "https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg"
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-small-ade")
inputs = feature_extractor(images=image, return_tensors="pt")

model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-small-ade")
outputs = model(**inputs)
# model predicts class_queries_logits of shape `(batch_size, num_queries)`
# and masks_queries_logits of shape `(batch_size, num_queries, height, width)`
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits

# you can pass them to feature_extractor for postprocessing
# we refer to the demo notebooks for visualization (see "Resources" section in the MaskFormer docs)
predicted_semantic_map = feature_extractor.post_process_semantic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]