圖像分割

2025年最佳 393 款圖像分割工具

Clipseg Rd64 Refined

CLIPSeg是一種基於文本與圖像提示的圖像分割模型，支持零樣本和單樣本圖像分割任務。

BRIA RMBG v1.4 是一款先進的背景移除模型，專為高效分離各類圖像的前景與背景而設計，適用於非商業用途。

BRIA AI開發的最新背景移除模型，能有效分離各類圖像的前景與背景，適合大規模商業內容創作場景。

Segformer B2 Clothes

基於ATR數據集微調的SegFormer模型，用於服裝和人體分割

SAM是一個能夠通過輸入提示（如點或框）生成高質量對象掩碼的視覺模型，支持零樣本分割任務

Transformers 其他

BiRefNet是一個用於高分辨率二分圖像分割的深度學習模型，通過雙邊參考網絡實現精確的圖像分割。

Segformer B1 Finetuned Ade 512 512

SegFormer是一種基於Transformer的語義分割模型，在ADE20K數據集上進行了微調，適用於圖像分割任務。

SAM是一個能夠通過輸入提示點或邊界框生成高質量物體掩膜的視覺模型，具備零樣本遷移能力。

Transformers 其他

基於nvidia/mit-b5微調的語義分割模型，用於面部解析任務

Transformers 英語

SAM是一個能夠根據輸入提示生成高質量對象掩碼的視覺模型，支持零樣本遷移到新任務

Transformers 其他

Mask2former Swin Large Cityscapes Semantic

基於Swin骨幹網絡的大尺寸Mask2Former模型，專為Cityscapes語義分割任務訓練，採用統一架構處理多種圖像分割任務。

Mask2former Swin Large Ade Semantic

基於Swin骨幹網絡的大規模版本，在ADE20k語義分割數據集上訓練的Mask2Former模型，採用統一範式處理圖像分割任務。

Sam2.1 Hiera Large

SAM 2是FAIR研發的面向圖像與視頻可提示視覺分割的基礎模型，支持通過提示進行通用分割任務。

Segformer B0 Finetuned Ade 512 512

SegFormer是一個基於Transformer架構的語義分割模型，在ADE20k數據集上進行了微調，適用於512x512分辨率的圖像分割任務。

Chest X Ray Basic

該模型可對胸部X光片同時執行分割和分類任務，包括肺部/心臟分割、體位識別、年齡和性別預測。

Oneformer Coco Swin Large

OneFormer是首個多任務通用圖像分割框架，通過單一模型實現語義分割、實例分割和全景分割任務

Sam2 Hiera Large

FAIR研發的面向圖像與視頻可提示視覺分割的基礎模型

Mask2former Swin Tiny Coco Instance

基於COCO數據集訓練的Mask2Former微型版實例分割模型，採用Swin骨幹網絡，統一處理分割任務

Oneformer Ade20k Swin Large

OneFormer是首個多任務通用圖像分割框架，通過單一模型支持語義分割、實例分割和全景分割任務。

Birefnet HR Matting

BiRefNet是一個基於雙邊參考的高分辨率二分圖像分割模型，專為高分辨率透明圖像摳圖設計。

Segformer B3 Clothes

基於ATR數據集微調的SegFormer模型，主要用於服裝分割，也可用於人體分割

SegFormer是一個基於Transformer的語義分割模型，採用分層編碼器和輕量級MLP解碼頭設計，在ADE20K和Cityscapes等基準測試中表現優異。

Segformer B3 Fashion

基於SegFormer架構的時尚物品圖像分割模型，專門用於識別和分割服裝及配飾

Oneformer Cityscapes Dinat Large

基於Cityscapes數據集訓練的多任務通用圖像分割模型，支持語義分割、實例分割和全景分割任務

Mask2former Swin Tiny Cityscapes Semantic

Mask2Former 是一種統一的圖像分割框架，能夠處理實例分割、語義分割和全景分割任務。該模型基於Swin-Tiny骨幹網絡，並在Cityscapes數據集上進行了語義分割任務的微調。

基於YOLOv8和YOLOv11架構訓練的一系列目標檢測與分割模型，專注於藝術圖像處理

圖像分割其他

Mask2former Swin Base Coco Panoptic

基於Swin骨幹網絡的Mask2Former模型，在COCO全景分割數據集上訓練，採用統一範式處理實例分割、語義分割和全景分割任務。

Segformer B2 Finetuned Ade 512 512

SegFormer是一個基於Transformer架構的語義分割模型，在ADE20k數據集上進行了微調，適用於512x512分辨率的圖像分割任務。

Upernet Convnext Small

UperNet是一種用於語義分割的框架，採用ConvNeXt作為骨幹網絡，能夠實現像素級的語義標籤預測。

Transformers 英語

Segformer B5 Finetuned Ade 640 640

SegFormer是一個基於Transformer架構的語義分割模型，在ADE20k數據集上進行了微調，適用於圖像分割任務。

Sam2 Hiera Tiny

SAM 2是FAIR研發的面向圖像和視頻可提示視覺分割的基礎模型，支持通過提示進行高效分割。

Mask2former Swin Large Coco Panoptic

基於Swin骨幹網絡的Mask2Former大型版本，專為COCO數據集全景分割任務訓練的統一圖像分割模型

Mask2former Swin Large Coco Instance

Mask2Former是基於Transformer的統一圖像分割模型，採用Swin-Large骨幹網絡並在COCO數據集上微調，專精實例分割任務

BiRefNet是一個用於高分辨率二分圖像分割的雙邊參考框架模型，專注於背景去除和掩膜生成任務。

Segformer B5 Finetuned Cityscapes 1024 1024

在1024x1024分辨率下對CityScapes數據集進行微調的SegFormer語義分割模型，採用分層Transformer編碼器和輕量級全MLP解碼頭架構。

AM-RADIO是NVIDIA研究院開發的視覺基礎模型，採用聚合式架構實現多領域統一表徵，適用於各類計算機視覺任務。

Upernet Convnext Large

UperNet是一個語義分割框架，結合ConvNeXt大型骨幹網絡，用於像素級語義標籤預測。

Transformers 英語

Segformer B1 Finetuned Cityscapes 1024 1024

該SegFormer模型在1024x1024分辨率下針對CityScapes數據集進行了微調，採用分層式Transformer編碼器和輕量級全MLP解碼頭架構。

Slimsam Uniform 77

SlimSAM是一種創新的SAM模型壓縮方法，通過統一剪枝-蒸餾框架高效複用預訓練SAM，無需大量重複訓練。

Transformers 其他

Sam2 Hiera Base Plus

SAM 2是FAIR研發的面向圖像和視頻可提示視覺分割的基礎模型，支持通過提示進行高效分割。

Mask2former Swin Small Coco Instance

Mask2Former是基於Transformer的統一圖像分割模型，在COCO數據集上微調用於實例分割任務

SegFormer是一個基於Transformer的語義分割模型，本版本僅包含在Imagenet-1k上預訓練的編碼器部分。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase