图像分割

2025年最佳的 393 个图像分割工具

Clipseg Rd64 Refined

CLIPSeg是一种基于文本与图像提示的图像分割模型，支持零样本和单样本图像分割任务。

BRIA RMBG v1.4 是一款先进的背景移除模型，专为高效分离各类图像的前景与背景而设计，适用于非商业用途。

BRIA AI开发的最新背景移除模型，能有效分离各类图像的前景与背景，适合大规模商业内容创作场景。

Segformer B2 Clothes

基于ATR数据集微调的SegFormer模型，用于服装和人体分割

SAM是一个能够通过输入提示（如点或框）生成高质量对象掩码的视觉模型，支持零样本分割任务

Transformers 其他

BiRefNet是一个用于高分辨率二分图像分割的深度学习模型，通过双边参考网络实现精确的图像分割。

Segformer B1 Finetuned Ade 512 512

SegFormer是一种基于Transformer的语义分割模型，在ADE20K数据集上进行了微调，适用于图像分割任务。

SAM是一个能够通过输入提示点或边界框生成高质量物体掩膜的视觉模型，具备零样本迁移能力。

Transformers 其他

基于nvidia/mit-b5微调的语义分割模型，用于面部解析任务

Transformers 英语

SAM是一个能够根据输入提示生成高质量对象掩码的视觉模型，支持零样本迁移到新任务

Transformers 其他

Mask2former Swin Large Cityscapes Semantic

基于Swin骨干网络的大尺寸Mask2Former模型，专为Cityscapes语义分割任务训练，采用统一架构处理多种图像分割任务。

Mask2former Swin Large Ade Semantic

基于Swin骨干网络的大规模版本，在ADE20k语义分割数据集上训练的Mask2Former模型，采用统一范式处理图像分割任务。

Sam2.1 Hiera Large

SAM 2是FAIR研发的面向图像与视频可提示视觉分割的基础模型，支持通过提示进行通用分割任务。

Segformer B0 Finetuned Ade 512 512

SegFormer是一个基于Transformer架构的语义分割模型，在ADE20k数据集上进行了微调，适用于512x512分辨率的图像分割任务。

Chest X Ray Basic

该模型可对胸部X光片同时执行分割和分类任务，包括肺部/心脏分割、体位识别、年龄和性别预测。

Oneformer Coco Swin Large

OneFormer是首个多任务通用图像分割框架，通过单一模型实现语义分割、实例分割和全景分割任务

Sam2 Hiera Large

FAIR研发的面向图像与视频可提示视觉分割的基础模型

Mask2former Swin Tiny Coco Instance

基于COCO数据集训练的Mask2Former微型版实例分割模型，采用Swin骨干网络，统一处理分割任务

Oneformer Ade20k Swin Large

OneFormer是首个多任务通用图像分割框架，通过单一模型支持语义分割、实例分割和全景分割任务。

Birefnet HR Matting

BiRefNet是一个基于双边参考的高分辨率二分图像分割模型，专为高分辨率透明图像抠图设计。

Segformer B3 Clothes

基于ATR数据集微调的SegFormer模型，主要用于服装分割，也可用于人体分割

SegFormer是一个基于Transformer的语义分割模型，采用分层编码器和轻量级MLP解码头设计，在ADE20K和Cityscapes等基准测试中表现优异。

Segformer B3 Fashion

基于SegFormer架构的时尚物品图像分割模型，专门用于识别和分割服装及配饰

Oneformer Cityscapes Dinat Large

基于Cityscapes数据集训练的多任务通用图像分割模型，支持语义分割、实例分割和全景分割任务

Mask2former Swin Tiny Cityscapes Semantic

Mask2Former 是一种统一的图像分割框架，能够处理实例分割、语义分割和全景分割任务。该模型基于Swin-Tiny骨干网络，并在Cityscapes数据集上进行了语义分割任务的微调。

基于YOLOv8和YOLOv11架构训练的一系列目标检测与分割模型，专注于艺术图像处理

图像分割其他

Mask2former Swin Base Coco Panoptic

基于Swin骨干网络的Mask2Former模型，在COCO全景分割数据集上训练，采用统一范式处理实例分割、语义分割和全景分割任务。

Segformer B2 Finetuned Ade 512 512

SegFormer是一个基于Transformer架构的语义分割模型，在ADE20k数据集上进行了微调，适用于512x512分辨率的图像分割任务。

Upernet Convnext Small

UperNet是一种用于语义分割的框架，采用ConvNeXt作为骨干网络，能够实现像素级的语义标签预测。

Transformers 英语

Segformer B5 Finetuned Ade 640 640

SegFormer是一个基于Transformer架构的语义分割模型，在ADE20k数据集上进行了微调，适用于图像分割任务。

Sam2 Hiera Tiny

SAM 2是FAIR研发的面向图像和视频可提示视觉分割的基础模型，支持通过提示进行高效分割。

Mask2former Swin Large Coco Panoptic

基于Swin骨干网络的Mask2Former大型版本，专为COCO数据集全景分割任务训练的统一图像分割模型

Mask2former Swin Large Coco Instance

Mask2Former是基于Transformer的统一图像分割模型，采用Swin-Large骨干网络并在COCO数据集上微调，专精实例分割任务

BiRefNet是一个用于高分辨率二分图像分割的双边参考框架模型，专注于背景去除和掩膜生成任务。

Segformer B5 Finetuned Cityscapes 1024 1024

在1024x1024分辨率下对CityScapes数据集进行微调的SegFormer语义分割模型，采用分层Transformer编码器和轻量级全MLP解码头架构。

AM-RADIO是NVIDIA研究院开发的视觉基础模型，采用聚合式架构实现多领域统一表征，适用于各类计算机视觉任务。

Upernet Convnext Large

UperNet是一个语义分割框架，结合ConvNeXt大型骨干网络，用于像素级语义标签预测。

Transformers 英语

Segformer B1 Finetuned Cityscapes 1024 1024

该SegFormer模型在1024x1024分辨率下针对CityScapes数据集进行了微调，采用分层式Transformer编码器和轻量级全MLP解码头架构。

Slimsam Uniform 77

SlimSAM是一种创新的SAM模型压缩方法，通过统一剪枝-蒸馏框架高效复用预训练SAM，无需大量重复训练。

Transformers 其他

Sam2 Hiera Base Plus

SAM 2是FAIR研发的面向图像和视频可提示视觉分割的基础模型，支持通过提示进行高效分割。

Mask2former Swin Small Coco Instance

Mask2Former是基于Transformer的统一图像分割模型，在COCO数据集上微调用于实例分割任务

SegFormer是一个基于Transformer的语义分割模型，本版本仅包含在Imagenet-1k上预训练的编码器部分。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase