2025年最佳的 393 个图像分割工具

Clipseg Rd64 Refined
Apache-2.0
CLIPSeg是一种基于文本与图像提示的图像分割模型,支持零样本和单样本图像分割任务。
图像分割 Transformers
C
CIDAS
10.0M
122
RMBG 1.4
其他
BRIA RMBG v1.4 是一款先进的背景移除模型,专为高效分离各类图像的前景与背景而设计,适用于非商业用途。
图像分割 Transformers
R
briaai
874.12k
1,771
RMBG 2.0
其他
BRIA AI开发的最新背景移除模型,能有效分离各类图像的前景与背景,适合大规模商业内容创作场景。
图像分割 Transformers
R
briaai
703.33k
741
Segformer B2 Clothes
MIT
基于ATR数据集微调的SegFormer模型,用于服装和人体分割
图像分割 Transformers
S
mattmdjaga
666.39k
410
Sam Vit Base
Apache-2.0
SAM是一个能够通过输入提示(如点或框)生成高质量对象掩码的视觉模型,支持零样本分割任务
图像分割 Transformers 其他
S
facebook
635.09k
137
Birefnet
MIT
BiRefNet是一个用于高分辨率二分图像分割的深度学习模型,通过双边参考网络实现精确的图像分割。
图像分割 Transformers
B
ZhengPeng7
626.54k
365
Segformer B1 Finetuned Ade 512 512
其他
SegFormer是一种基于Transformer的语义分割模型,在ADE20K数据集上进行了微调,适用于图像分割任务。
图像分割 Transformers
S
nvidia
560.79k
6
Sam Vit Large
Apache-2.0
SAM是一个能够通过输入提示点或边界框生成高质量物体掩膜的视觉模型,具备零样本迁移能力。
图像分割 Transformers 其他
S
facebook
455.43k
28
Face Parsing
基于nvidia/mit-b5微调的语义分割模型,用于面部解析任务
图像分割 Transformers 英语
F
jonathandinu
398.59k
157
Sam Vit Huge
Apache-2.0
SAM是一个能够根据输入提示生成高质量对象掩码的视觉模型,支持零样本迁移到新任务
图像分割 Transformers 其他
S
facebook
324.78k
163
Mask2former Swin Large Cityscapes Semantic
其他
基于Swin骨干网络的大尺寸Mask2Former模型,专为Cityscapes语义分割任务训练,采用统一架构处理多种图像分割任务。
图像分割 Transformers
M
facebook
296.33k
24
Mask2former Swin Large Ade Semantic
其他
基于Swin骨干网络的大规模版本,在ADE20k语义分割数据集上训练的Mask2Former模型,采用统一范式处理图像分割任务。
图像分割 Transformers
M
facebook
238.92k
15
Sam2.1 Hiera Large
Apache-2.0
SAM 2是FAIR研发的面向图像与视频可提示视觉分割的基础模型,支持通过提示进行通用分割任务。
图像分割
S
facebook
203.27k
81
Segformer B0 Finetuned Ade 512 512
其他
SegFormer是一个基于Transformer架构的语义分割模型,在ADE20k数据集上进行了微调,适用于512x512分辨率的图像分割任务。
图像分割 Transformers
S
nvidia
179.04k
156
Chest X Ray Basic
该模型可对胸部X光片同时执行分割和分类任务,包括肺部/心脏分割、体位识别、年龄和性别预测。
图像分割 Transformers
C
ianpan
175.20k
1
Oneformer Coco Swin Large
MIT
OneFormer是首个多任务通用图像分割框架,通过单一模型实现语义分割、实例分割和全景分割任务
图像分割 Transformers
O
shi-labs
165.70k
3
Sam2 Hiera Large
Apache-2.0
FAIR研发的面向图像与视频可提示视觉分割的基础模型
图像分割
S
facebook
155.85k
68
Mask2former Swin Tiny Coco Instance
其他
基于COCO数据集训练的Mask2Former微型版实例分割模型,采用Swin骨干网络,统一处理分割任务
图像分割 Transformers
M
facebook
149.85k
7
Oneformer Ade20k Swin Large
MIT
OneFormer是首个多任务通用图像分割框架,通过单一模型支持语义分割、实例分割和全景分割任务。
图像分割 Transformers
O
shi-labs
141.57k
24
Birefnet HR Matting
MIT
BiRefNet是一个基于双边参考的高分辨率二分图像分割模型,专为高分辨率透明图像抠图设计。
图像分割 Safetensors
B
ZhengPeng7
141.30k
2
Segformer B3 Clothes
MIT
基于ATR数据集微调的SegFormer模型,主要用于服装分割,也可用于人体分割
图像分割 Transformers
S
sayeed99
102.42k
23
Mit B0
其他
SegFormer是一个基于Transformer的语义分割模型,采用分层编码器和轻量级MLP解码头设计,在ADE20K和Cityscapes等基准测试中表现优异。
图像分割 Transformers
M
nvidia
83.99k
35
Segformer B3 Fashion
其他
基于SegFormer架构的时尚物品图像分割模型,专门用于识别和分割服装及配饰
图像分割 Transformers
S
sayeed99
75.65k
21
Oneformer Cityscapes Dinat Large
MIT
基于Cityscapes数据集训练的多任务通用图像分割模型,支持语义分割、实例分割和全景分割任务
图像分割 Transformers
O
shi-labs
70.19k
0
Mask2former Swin Tiny Cityscapes Semantic
其他
Mask2Former 是一种统一的图像分割框架,能够处理实例分割、语义分割和全景分割任务。该模型基于Swin-Tiny骨干网络,并在Cityscapes数据集上进行了语义分割任务的微调。
图像分割 Transformers
M
facebook
55.98k
3
Anzhcs YOLOs
基于YOLOv8和YOLOv11架构训练的一系列目标检测与分割模型,专注于艺术图像处理
图像分割 其他
A
Anzhc
48.07k
44
Mask2former Swin Base Coco Panoptic
其他
基于Swin骨干网络的Mask2Former模型,在COCO全景分割数据集上训练,采用统一范式处理实例分割、语义分割和全景分割任务。
图像分割 Transformers
M
facebook
45.01k
14
Segformer B2 Finetuned Ade 512 512
其他
SegFormer是一个基于Transformer架构的语义分割模型,在ADE20k数据集上进行了微调,适用于512x512分辨率的图像分割任务。
图像分割 Transformers
S
nvidia
44.07k
3
Upernet Convnext Small
MIT
UperNet是一种用于语义分割的框架,采用ConvNeXt作为骨干网络,能够实现像素级的语义标签预测。
图像分割 Transformers 英语
U
openmmlab
43.31k
31
Segformer B5 Finetuned Ade 640 640
其他
SegFormer是一个基于Transformer架构的语义分割模型,在ADE20k数据集上进行了微调,适用于图像分割任务。
图像分割 Transformers
S
nvidia
42.32k
39
Sam2 Hiera Tiny
Apache-2.0
SAM 2是FAIR研发的面向图像和视频可提示视觉分割的基础模型,支持通过提示进行高效分割。
图像分割
S
facebook
41.88k
20
Mask2former Swin Large Coco Panoptic
其他
基于Swin骨干网络的Mask2Former大型版本,专为COCO数据集全景分割任务训练的统一图像分割模型
图像分割 Transformers
M
facebook
37.67k
30
Mask2former Swin Large Coco Instance
其他
Mask2Former是基于Transformer的统一图像分割模型,采用Swin-Large骨干网络并在COCO数据集上微调,专精实例分割任务
图像分割 Transformers
M
facebook
37.31k
6
Birefnet HR
MIT
BiRefNet是一个用于高分辨率二分图像分割的双边参考框架模型,专注于背景去除和掩膜生成任务。
图像分割 Safetensors
B
ZhengPeng7
35.07k
62
Segformer B5 Finetuned Cityscapes 1024 1024
其他
在1024x1024分辨率下对CityScapes数据集进行微调的SegFormer语义分割模型,采用分层Transformer编码器和轻量级全MLP解码头架构。
图像分割 Transformers
S
nvidia
31.18k
24
RADIO L
AM-RADIO是NVIDIA研究院开发的视觉基础模型,采用聚合式架构实现多领域统一表征,适用于各类计算机视觉任务。
图像分割 Transformers
R
nvidia
23.27k
8
Upernet Convnext Large
MIT
UperNet是一个语义分割框架,结合ConvNeXt大型骨干网络,用于像素级语义标签预测。
图像分割 Transformers 英语
U
openmmlab
23.09k
0
Segformer B1 Finetuned Cityscapes 1024 1024
其他
该SegFormer模型在1024x1024分辨率下针对CityScapes数据集进行了微调,采用分层式Transformer编码器和轻量级全MLP解码头架构。
图像分割 Transformers
S
nvidia
20.27k
17
Slimsam Uniform 77
Apache-2.0
SlimSAM是一种创新的SAM模型压缩方法,通过统一剪枝-蒸馏框架高效复用预训练SAM,无需大量重复训练。
图像分割 Transformers 其他
S
Zigeng
18.82k
24
Sam2 Hiera Base Plus
Apache-2.0
SAM 2是FAIR研发的面向图像和视频可提示视觉分割的基础模型,支持通过提示进行高效分割。
图像分割
S
facebook
18.17k
6
Mask2former Swin Small Coco Instance
其他
Mask2Former是基于Transformer的统一图像分割模型,在COCO数据集上微调用于实例分割任务
图像分割 Transformers
M
facebook
17.51k
7
Mit B5
其他
SegFormer是一个基于Transformer的语义分割模型,本版本仅包含在Imagenet-1k上预训练的编码器部分。
图像分割 Transformers
M
nvidia
15.94k
9
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase