Clipseg Rd64 Refined
Apache-2.0
CLIPSeg是一種基於文本與圖像提示的圖像分割模型,支持零樣本和單樣本圖像分割任務。
圖像分割
Transformers

C
CIDAS
10.0M
122
RMBG 1.4
其他
BRIA RMBG v1.4 是一款先進的背景移除模型,專為高效分離各類圖像的前景與背景而設計,適用於非商業用途。
圖像分割
Transformers

R
briaai
874.12k
1,771
RMBG 2.0
其他
BRIA AI開發的最新背景移除模型,能有效分離各類圖像的前景與背景,適合大規模商業內容創作場景。
圖像分割
Transformers

R
briaai
703.33k
741
Segformer B2 Clothes
MIT
基於ATR數據集微調的SegFormer模型,用於服裝和人體分割
圖像分割
Transformers

S
mattmdjaga
666.39k
410
Sam Vit Base
Apache-2.0
SAM是一個能夠通過輸入提示(如點或框)生成高質量對象掩碼的視覺模型,支持零樣本分割任務
圖像分割
Transformers 其他

S
facebook
635.09k
137
Birefnet
MIT
BiRefNet是一個用於高分辨率二分圖像分割的深度學習模型,通過雙邊參考網絡實現精確的圖像分割。
圖像分割
Transformers

B
ZhengPeng7
626.54k
365
Segformer B1 Finetuned Ade 512 512
其他
SegFormer是一種基於Transformer的語義分割模型,在ADE20K數據集上進行了微調,適用於圖像分割任務。
圖像分割
Transformers

S
nvidia
560.79k
6
Sam Vit Large
Apache-2.0
SAM是一個能夠通過輸入提示點或邊界框生成高質量物體掩膜的視覺模型,具備零樣本遷移能力。
圖像分割
Transformers 其他

S
facebook
455.43k
28
Face Parsing
基於nvidia/mit-b5微調的語義分割模型,用於面部解析任務
圖像分割
Transformers 英語

F
jonathandinu
398.59k
157
Sam Vit Huge
Apache-2.0
SAM是一個能夠根據輸入提示生成高質量對象掩碼的視覺模型,支持零樣本遷移到新任務
圖像分割
Transformers 其他

S
facebook
324.78k
163
Mask2former Swin Large Cityscapes Semantic
其他
基於Swin骨幹網絡的大尺寸Mask2Former模型,專為Cityscapes語義分割任務訓練,採用統一架構處理多種圖像分割任務。
圖像分割
Transformers

M
facebook
296.33k
24
Mask2former Swin Large Ade Semantic
其他
基於Swin骨幹網絡的大規模版本,在ADE20k語義分割數據集上訓練的Mask2Former模型,採用統一範式處理圖像分割任務。
圖像分割
Transformers

M
facebook
238.92k
15
Sam2.1 Hiera Large
Apache-2.0
SAM 2是FAIR研發的面向圖像與視頻可提示視覺分割的基礎模型,支持通過提示進行通用分割任務。
圖像分割
S
facebook
203.27k
81
Segformer B0 Finetuned Ade 512 512
其他
SegFormer是一個基於Transformer架構的語義分割模型,在ADE20k數據集上進行了微調,適用於512x512分辨率的圖像分割任務。
圖像分割
Transformers

S
nvidia
179.04k
156
Chest X Ray Basic
該模型可對胸部X光片同時執行分割和分類任務,包括肺部/心臟分割、體位識別、年齡和性別預測。
圖像分割
Transformers

C
ianpan
175.20k
1
Oneformer Coco Swin Large
MIT
OneFormer是首個多任務通用圖像分割框架,通過單一模型實現語義分割、實例分割和全景分割任務
圖像分割
Transformers

O
shi-labs
165.70k
3
Sam2 Hiera Large
Apache-2.0
FAIR研發的面向圖像與視頻可提示視覺分割的基礎模型
圖像分割
S
facebook
155.85k
68
Mask2former Swin Tiny Coco Instance
其他
基於COCO數據集訓練的Mask2Former微型版實例分割模型,採用Swin骨幹網絡,統一處理分割任務
圖像分割
Transformers

M
facebook
149.85k
7
Oneformer Ade20k Swin Large
MIT
OneFormer是首個多任務通用圖像分割框架,通過單一模型支持語義分割、實例分割和全景分割任務。
圖像分割
Transformers

O
shi-labs
141.57k
24
Birefnet HR Matting
MIT
BiRefNet是一個基於雙邊參考的高分辨率二分圖像分割模型,專為高分辨率透明圖像摳圖設計。
圖像分割
Safetensors
B
ZhengPeng7
141.30k
2
Segformer B3 Clothes
MIT
基於ATR數據集微調的SegFormer模型,主要用於服裝分割,也可用於人體分割
圖像分割
Transformers

S
sayeed99
102.42k
23
Mit B0
其他
SegFormer是一個基於Transformer的語義分割模型,採用分層編碼器和輕量級MLP解碼頭設計,在ADE20K和Cityscapes等基準測試中表現優異。
圖像分割
Transformers

M
nvidia
83.99k
35
Segformer B3 Fashion
其他
基於SegFormer架構的時尚物品圖像分割模型,專門用於識別和分割服裝及配飾
圖像分割
Transformers

S
sayeed99
75.65k
21
Oneformer Cityscapes Dinat Large
MIT
基於Cityscapes數據集訓練的多任務通用圖像分割模型,支持語義分割、實例分割和全景分割任務
圖像分割
Transformers

O
shi-labs
70.19k
0
Mask2former Swin Tiny Cityscapes Semantic
其他
Mask2Former 是一種統一的圖像分割框架,能夠處理實例分割、語義分割和全景分割任務。該模型基於Swin-Tiny骨幹網絡,並在Cityscapes數據集上進行了語義分割任務的微調。
圖像分割
Transformers

M
facebook
55.98k
3
Anzhcs YOLOs
基於YOLOv8和YOLOv11架構訓練的一系列目標檢測與分割模型,專注於藝術圖像處理
圖像分割 其他
A
Anzhc
48.07k
44
Mask2former Swin Base Coco Panoptic
其他
基於Swin骨幹網絡的Mask2Former模型,在COCO全景分割數據集上訓練,採用統一範式處理實例分割、語義分割和全景分割任務。
圖像分割
Transformers

M
facebook
45.01k
14
Segformer B2 Finetuned Ade 512 512
其他
SegFormer是一個基於Transformer架構的語義分割模型,在ADE20k數據集上進行了微調,適用於512x512分辨率的圖像分割任務。
圖像分割
Transformers

S
nvidia
44.07k
3
Upernet Convnext Small
MIT
UperNet是一種用於語義分割的框架,採用ConvNeXt作為骨幹網絡,能夠實現像素級的語義標籤預測。
圖像分割
Transformers 英語

U
openmmlab
43.31k
31
Segformer B5 Finetuned Ade 640 640
其他
SegFormer是一個基於Transformer架構的語義分割模型,在ADE20k數據集上進行了微調,適用於圖像分割任務。
圖像分割
Transformers

S
nvidia
42.32k
39
Sam2 Hiera Tiny
Apache-2.0
SAM 2是FAIR研發的面向圖像和視頻可提示視覺分割的基礎模型,支持通過提示進行高效分割。
圖像分割
S
facebook
41.88k
20
Mask2former Swin Large Coco Panoptic
其他
基於Swin骨幹網絡的Mask2Former大型版本,專為COCO數據集全景分割任務訓練的統一圖像分割模型
圖像分割
Transformers

M
facebook
37.67k
30
Mask2former Swin Large Coco Instance
其他
Mask2Former是基於Transformer的統一圖像分割模型,採用Swin-Large骨幹網絡並在COCO數據集上微調,專精實例分割任務
圖像分割
Transformers

M
facebook
37.31k
6
Birefnet HR
MIT
BiRefNet是一個用於高分辨率二分圖像分割的雙邊參考框架模型,專注於背景去除和掩膜生成任務。
圖像分割
Safetensors
B
ZhengPeng7
35.07k
62
Segformer B5 Finetuned Cityscapes 1024 1024
其他
在1024x1024分辨率下對CityScapes數據集進行微調的SegFormer語義分割模型,採用分層Transformer編碼器和輕量級全MLP解碼頭架構。
圖像分割
Transformers

S
nvidia
31.18k
24
RADIO L
AM-RADIO是NVIDIA研究院開發的視覺基礎模型,採用聚合式架構實現多領域統一表徵,適用於各類計算機視覺任務。
圖像分割
Transformers

R
nvidia
23.27k
8
Upernet Convnext Large
MIT
UperNet是一個語義分割框架,結合ConvNeXt大型骨幹網絡,用於像素級語義標籤預測。
圖像分割
Transformers 英語

U
openmmlab
23.09k
0
Segformer B1 Finetuned Cityscapes 1024 1024
其他
該SegFormer模型在1024x1024分辨率下針對CityScapes數據集進行了微調,採用分層式Transformer編碼器和輕量級全MLP解碼頭架構。
圖像分割
Transformers

S
nvidia
20.27k
17
Slimsam Uniform 77
Apache-2.0
SlimSAM是一種創新的SAM模型壓縮方法,通過統一剪枝-蒸餾框架高效複用預訓練SAM,無需大量重複訓練。
圖像分割
Transformers 其他

S
Zigeng
18.82k
24
Sam2 Hiera Base Plus
Apache-2.0
SAM 2是FAIR研發的面向圖像和視頻可提示視覺分割的基礎模型,支持通過提示進行高效分割。
圖像分割
S
facebook
18.17k
6
Mask2former Swin Small Coco Instance
其他
Mask2Former是基於Transformer的統一圖像分割模型,在COCO數據集上微調用於實例分割任務
圖像分割
Transformers

M
facebook
17.51k
7
Mit B5
其他
SegFormer是一個基於Transformer的語義分割模型,本版本僅包含在Imagenet-1k上預訓練的編碼器部分。
圖像分割
Transformers

M
nvidia
15.94k
9
- 1
- 2
- 3
- 4
- 5
- 6
- 10