Medsam2 Oct
Apache-2.0
一個基於Apache-2.0許可的開源圖像分割模型,適用於多種圖像分割任務。
圖像分割
M
Dramb
40
0
Upernet Convnext Large
MIT
基於ConvNeXt-Large編碼器的UPerNet語義分割模型,適用於ADE20K等場景解析任務
圖像分割
U
smp-hub
54
0
Upernet Convnext Base
MIT
基於ConvNeXt架構的UPerNet圖像分割模型,適用於語義分割任務
圖像分割
U
smp-hub
57
0
Rm
其他
BRIA RMBG v2.0是最先進的背景移除模型,專為高效分離各類圖像的前景與背景而設計,適用於非商業用途。
圖像分割
Transformers

R
cocktailpeanut
1,769
0
Aggregate Segmentation
MIT
基於PyTorch的DeepLabV3Plus圖像分割模型,支持高效的語義分割任務
圖像分割
A
Matiullah2401592
78
1
Coco Instance Eomt Large 1280
MIT
該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法,展示了ViT在圖像分割任務中的潛力。
圖像分割
PyTorch
C
tue-mps
105
0
Ade20k Panoptic Eomt Giant 1280
MIT
該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法,揭示了ViT在圖像分割任務中的潛力。
圖像分割
A
tue-mps
96
0
Ade20k Panoptic Eomt Large 1280
MIT
該論文提出了一種基於Vision Transformer (ViT) 的圖像分割模型,揭示了ViT在圖像分割任務中的潛力。
圖像分割
A
tue-mps
129
0
Ade20k Panoptic Eomt Large 640
MIT
該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法,展示了ViT在圖像分割任務中的潛力。
圖像分割
A
tue-mps
105
0
Ade20k Panoptic Eomt Giant 640
MIT
該模型揭示了Vision Transformer (ViT) 在圖像分割任務中的潛力,通過特定架構調整使其適用於分割任務。
圖像分割
A
tue-mps
116
0
Coco Panoptic Eomt Giant 640
MIT
該論文提出的模型揭示了Vision Transformer (ViT)在圖像分割任務中的潛在能力。
圖像分割
C
tue-mps
92
0
Coco Panoptic Eomt Large 1280
MIT
該論文提出了一種新的視角,將Vision Transformer (ViT) 視為圖像分割模型,並探討了其在圖像分割任務中的潛力。
圖像分割
PyTorch
C
tue-mps
119
0
Ade20k Semantic Eomt Large 512
MIT
該模型基於論文《你的ViT實際上是圖像分割模型》開發,是一種用於圖像分割任務的視覺Transformer模型。
圖像分割
PyTorch
A
tue-mps
108
0
Cityscapes Semantic Eomt Large 1024
MIT
該模型揭示了Vision Transformer (ViT) 在圖像分割任務中的潛力,通過特定方法將ViT轉化為高效的圖像分割模型。
圖像分割
PyTorch
C
tue-mps
85
0
Coco Panoptic Eomt Large 640
MIT
該模型揭示了Vision Transformer (ViT) 在圖像分割任務中的潛力,通過特定架構調整使其適用於分割任務。
圖像分割
C
tue-mps
217
0
Coco Instance Eomt Large 640
MIT
該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法,展示了ViT在圖像分割任務中的潛力。
圖像分割
C
tue-mps
99
0
Coco Panoptic Eomt Giant 1280
MIT
該模型通過重新思考Vision Transformer (ViT) 的架構,展示了其在圖像分割任務中的潛力。
圖像分割
PyTorch
C
tue-mps
90
0
Internvl2 5 HiMTok 8B
Apache-2.0
HiMTok是一個基於InternVL2_5-8B大型多模態模型微調的分層掩碼標記學習框架,專注於圖像分割任務。
圖像生成文本
I
yayafengzi
16
3
Rrwnet Rite
RRWNet是一種用於視網膜動靜脈分割的遞歸優化網絡,特別針對RITE數據集訓練
圖像分割
R
j-morano
40
0
Table Transformer Page Segmentation Floorplan
這是一個基於Transformer架構的圖像分割模型,專門用於處理頁面佈局和平面圖的分割任務。
圖像分割
Transformers

T
digscom
22
0
Mask2former Deployment
其他
基於Mask2Former框架微調的語義分割模型,適用於道路場景理解和自動駕駛等應用
圖像分割
M
saninmohammedn
229
1
Segformer B5 640x640 Ade 160k
其他
基於PyTorch的Segformer圖像分割模型,適用於ADE20K數據集的語義分割任務
圖像分割
S
smp-hub
274
0
Detr Layout Detection
Apache-2.0
基於DETR架構的文檔佈局檢測模型,能夠識別文檔中的多種佈局元素。
目標檢測
Transformers

D
cmarkea
13.21k
20
Medsam Breast Cancer
基於Transformers庫的圖像分割模型,用於視覺任務中的圖像分割處理
圖像分割
Transformers 其他

M
MichaelSoloveitchik
61
0
Speaker Segmentation Fine Tuned Callhome Jpn
MIT
這是一個基於pyannote/segmentation-3.0基礎模型微調的說話人日誌模型,專門針對日語電話對話場景優化。
說話人處理
Transformers

S
kamilakesbi
18
0
Segformer B0 Finetuned Segments Graffiti
其他
基於NVIDIA的SegFormer-B0架構,在塗鴉分割數據集上微調的圖像分割模型,能夠準確識別和分割圖像中的塗鴉區域。
圖像分割
Transformers

S
Adriatogi
14
0
Segformer Finetuned 4ss1st3r S3gs3m 24Jan All 10k Steps
其他
基於nvidia/mit-b0架構微調的圖像分割模型,專注於檢測多種材料缺陷類型
圖像分割
Transformers

S
blzncz
16
0
Safety Utcustom Train SF RGBD B5
其他
基於nvidia/mit-b5微調的安全視覺分割模型,專注於RGBD圖像中的安全與危險區域識別
圖像分割
Transformers

S
sam1120
17
0
Breast Cancer SAM V1
Apache-2.0
基於Segment Anything Model (SAM)的乳腺癌分割模型,用於醫學影像中的腫瘤區域識別
圖像分割
Transformers 支持多種語言

B
ayoubkirouane
162
11
Some Chives SF
一個用於圖像分割任務的深度學習模型,能夠將圖像中的不同對象或區域進行精確分割。
圖像分割
Transformers

S
TristanPermentier
14
0
Ecc Segformer Main
其他
基於nvidia/mit-b5微調的圖像分割模型,用於裂縫檢測任務
圖像分割
Transformers

E
rishitunu
15
0
Ecc Segformerv1
其他
基於nvidia/mit-b5微調的圖像分割模型,專注於裂縫檢測任務
圖像分割
Transformers

E
rishitunu
22
1
Segformer B4 Crack Segmentation Dataset
其他
基於SegFormer架構的裂縫分割模型,在裂縫分割數據集上微調,用於檢測圖像中的裂縫結構
圖像分割
Transformers 英語

S
varcoder
200
0
Yolov8s Seg Solar Panels
MIT
這是一個基於YOLOv8s架構訓練的實例分割模型,專門用於檢測和分割太陽能板圖像。
圖像分割
Y
finloop
35
7
Segformer B0 Finetuned Segments Stamp Verification
其他
基於nvidia/mit-b0在郵票驗證數據集上微調的語義分割模型,用於精確分割圖像中的郵票區域
圖像分割
Transformers

S
bilal01
82
2
Histo Train Segformer
其他
基於SegFormer架構的圖像分類模型,在imagefolder數據集上微調,準確率達87.5%
圖像分類
Transformers

H
tcvrishank
14
0
Bbsnet
MIT
BBS-Net是一種用於RGB-D顯著目標檢測的深度學習模型,採用分叉骨幹策略網絡結構,能夠有效處理RGB和深度圖像數據。
圖像分割
Transformers

B
RGBD-SOD
21
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基於LiLT和DocLayNet數據集微調的行級別文檔理解模型,支持多語言文檔佈局分析
圖像生成文本
Transformers 支持多種語言

L
pierreguillou
700
12
Upernet Convnext Large
MIT
UperNet是一個語義分割框架,結合ConvNeXt大型骨幹網絡,用於像素級語義標籤預測。
圖像分割
Transformers 英語

U
openmmlab
23.09k
0
Mask2former Swin Large Mapillary Vistas Semantic
其他
基於Swin骨幹網絡的大規模Mask2Former模型,專為通用圖像分割任務設計,統一處理實例分割、語義分割和全景分割。
圖像分割
Transformers

M
facebook
5,539
3
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98