upernet-swin-tiny开源图像分割模型 - 免费部署助力精准图像分割任务

首页

Upernet Swin Tiny

由 smp-hub 开发

UPerNet是一个基于ConvNeXt-Tiny架构的语义分割模型，适用于图像分割任务。

图像分割

Safetensors

开源协议:MIT #语义分割 #ConvNeXt骨干 #ADE20K适配

下载量 191

发布时间 : 4/12/2025

模型简介

该模型采用UPerNet架构，结合ConvNeXt-Tiny作为编码器，专门用于语义分割任务，能够准确识别和分割图像中的不同对象类别。

模型特点

高效分割

采用ConvNeXt-Tiny作为编码器，在保持高效推理的同时提供准确的分割结果。

预训练支持

提供预训练模型权重，便于快速部署和使用。

多类别分割

支持150个类别的语义分割，适用于复杂场景。

模型能力

图像语义分割

多类别对象识别

场景理解

使用案例

计算机视觉

场景解析

对复杂场景中的不同对象进行分割和识别

准确识别和分割150个类别的对象

自动驾驶

用于道路场景理解，识别车辆、行人、道路等元素

🚀 分割模型库（Segmentation-Models-PyTorch）之UPerNet模型

本项目基于segmentation-models-pytorch库，提供了UPerNet模型用于图像分割任务。UPerNet模型能够高效准确地对图像进行语义分割，为相关领域的研究和应用提供了有力支持。

🚀 快速开始

加载预训练模型

点击下面的按钮在Colab中运行示例：

步骤1：安装依赖

pip install -U segmentation_models_pytorch albumentations

步骤2：运行推理

import torch
import requests
import numpy as np
import albumentations as A
import segmentation_models_pytorch as smp

from PIL import Image

device = "cuda" if torch.cuda.is_available() else "cpu"

# 加载预训练模型和预处理函数
checkpoint = "smp-hub/upernet-convnext-tiny"
model = smp.from_pretrained(checkpoint).eval().to(device)
preprocessing = A.Compose.from_pretrained(checkpoint)

# 加载图像
url = "https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg"
image = Image.open(requests.get(url, stream=True).raw)

# 预处理图像
np_image = np.array(image)
normalized_image = preprocessing(image=np_image)["image"]
input_tensor = torch.as_tensor(normalized_image)
input_tensor = input_tensor.permute(2, 0, 1).unsqueeze(0)  # HWC -> BCHW
input_tensor = input_tensor.to(device)

# 进行推理
with torch.no_grad():
    output_mask = model(input_tensor)

# 后处理掩码
mask = mask.argmax(1).cpu().numpy()  # 在预测类别（通道维度）上取最大值

💻 使用示例

基础用法

上述加载预训练模型并进行推理的代码即为基础用法示例，可直接运行对图像进行分割。

高级用法

在实际应用中，你可能需要根据具体需求调整模型的初始化参数，以下是模型初始化参数的示例：

model_init_params = {
    "encoder_name": "tu-swin_tiny_patch4_window7_224",
    "encoder_depth": 5,
    "encoder_weights": None,
    "decoder_channels": 512,
    "decoder_use_norm": "batchnorm",
    "in_channels": 3,
    "classes": 150,
    "activation": None,
    "upsampling": 4,
    "aux_params": None,
    "img_size": 512
}