🚀 MaskFormer
MaskFormer是一个在ADE20k语义分割数据集上训练的模型(小尺寸版本,采用Swin骨干网络)。它在论文Per-Pixel Classification is Not All You Need for Semantic Segmentation中被提出,并首次在此仓库中发布。该模型使用同一范式处理实例分割、语义分割和全景分割任务,即通过预测一组掩码和相应的标签,将这3种任务都视为实例分割任务。
🚀 快速开始
你可以使用此特定的检查点进行语义分割。查看模型中心以查找针对你感兴趣的任务进行微调的其他版本。
✨ 主要特性
- 统一范式:MaskFormer使用同一范式处理实例分割、语义分割和全景分割任务,将这3种任务都视为实例分割任务。
- 模型架构:模型架构如图所示:

📦 安装指南
文档未提及安装步骤,故跳过此章节。
💻 使用示例
基础用法
from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests
url = "https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg"
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-small-ade")
inputs = feature_extractor(images=image, return_tensors="pt")
model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-small-ade")
outputs = model(**inputs)
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits
predicted_semantic_map = feature_extractor.post_process_semantic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]
高级用法
更多代码示例,请参考文档。
📚 详细文档
- 模型使用方法:可参考上述代码示例。
- 更多代码示例:请参考文档。
🔧 技术细节
文档未提及技术实现细节,故跳过此章节。
📄 许可证
该模型的许可证为其他(other)。
标签与数据集
属性 |
详情 |
模型类型 |
用于图像分割的MaskFormer模型 |
训练数据 |
scene_parse_150 |
示例
免责声明
发布MaskFormer的团队未为此模型编写模型卡片,此模型卡片由Hugging Face团队编写。