高精度分割

# 高精度分割

一個基於Apache-2.0許可的開源圖像分割模型，適用於多種圖像分割任務。

Upernet Convnext Large

基於ConvNeXt-Large編碼器的UPerNet語義分割模型，適用於ADE20K等場景解析任務

Upernet Convnext Base

基於ConvNeXt架構的UPerNet圖像分割模型，適用於語義分割任務

BRIA RMBG v2.0是最先進的背景移除模型，專為高效分離各類圖像的前景與背景而設計，適用於非商業用途。

Aggregate Segmentation

基於PyTorch的DeepLabV3Plus圖像分割模型，支持高效的語義分割任務

Matiullah2401592

Coco Instance Eomt Large 1280

該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法，展示了ViT在圖像分割任務中的潛力。

Ade20k Panoptic Eomt Giant 1280

該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法，揭示了ViT在圖像分割任務中的潛力。

Ade20k Panoptic Eomt Large 1280

該論文提出了一種基於Vision Transformer (ViT) 的圖像分割模型，揭示了ViT在圖像分割任務中的潛力。

Ade20k Panoptic Eomt Large 640

該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法，展示了ViT在圖像分割任務中的潛力。

Ade20k Panoptic Eomt Giant 640

該模型揭示了Vision Transformer (ViT) 在圖像分割任務中的潛力，通過特定架構調整使其適用於分割任務。

Coco Panoptic Eomt Giant 640

該論文提出的模型揭示了Vision Transformer (ViT)在圖像分割任務中的潛在能力。

Coco Panoptic Eomt Large 1280

該論文提出了一種新的視角，將Vision Transformer (ViT) 視為圖像分割模型，並探討了其在圖像分割任務中的潛力。

Ade20k Semantic Eomt Large 512

該模型基於論文《你的ViT實際上是圖像分割模型》開發，是一種用於圖像分割任務的視覺Transformer模型。

Cityscapes Semantic Eomt Large 1024

該模型揭示了Vision Transformer (ViT) 在圖像分割任務中的潛力，通過特定方法將ViT轉化為高效的圖像分割模型。

Coco Panoptic Eomt Large 640

該模型揭示了Vision Transformer (ViT) 在圖像分割任務中的潛力，通過特定架構調整使其適用於分割任務。

Coco Instance Eomt Large 640

該論文提出了一種將Vision Transformer (ViT) 重新解釋為圖像分割模型的方法，展示了ViT在圖像分割任務中的潛力。

Coco Panoptic Eomt Giant 1280

該模型通過重新思考Vision Transformer (ViT) 的架構，展示了其在圖像分割任務中的潛力。

Internvl2 5 HiMTok 8B

HiMTok是一個基於InternVL2_5-8B大型多模態模型微調的分層掩碼標記學習框架，專注於圖像分割任務。

圖像生成文本

RRWNet是一種用於視網膜動靜脈分割的遞歸優化網絡，特別針對RITE數據集訓練

Table Transformer Page Segmentation Floorplan

這是一個基於Transformer架構的圖像分割模型，專門用於處理頁面佈局和平面圖的分割任務。

Mask2former Deployment

基於Mask2Former框架微調的語義分割模型，適用於道路場景理解和自動駕駛等應用

Segformer B5 640x640 Ade 160k

基於PyTorch的Segformer圖像分割模型，適用於ADE20K數據集的語義分割任務

Detr Layout Detection

基於DETR架構的文檔佈局檢測模型，能夠識別文檔中的多種佈局元素。

Medsam Breast Cancer

基於Transformers庫的圖像分割模型，用於視覺任務中的圖像分割處理

Transformers 其他

MichaelSoloveitchik

Speaker Segmentation Fine Tuned Callhome Jpn

這是一個基於pyannote/segmentation-3.0基礎模型微調的說話人日誌模型，專門針對日語電話對話場景優化。

說話人處理

Segformer B0 Finetuned Segments Graffiti

基於NVIDIA的SegFormer-B0架構，在塗鴉分割數據集上微調的圖像分割模型，能夠準確識別和分割圖像中的塗鴉區域。

Segformer Finetuned 4ss1st3r S3gs3m 24Jan All 10k Steps

基於nvidia/mit-b0架構微調的圖像分割模型，專注於檢測多種材料缺陷類型

Safety Utcustom Train SF RGBD B5

基於nvidia/mit-b5微調的安全視覺分割模型，專注於RGBD圖像中的安全與危險區域識別

Breast Cancer SAM V1

基於Segment Anything Model (SAM)的乳腺癌分割模型，用於醫學影像中的腫瘤區域識別

Transformers 支持多種語言

一個用於圖像分割任務的深度學習模型，能夠將圖像中的不同對象或區域進行精確分割。

TristanPermentier

Ecc Segformer Main

基於nvidia/mit-b5微調的圖像分割模型，用於裂縫檢測任務

Ecc Segformerv1

基於nvidia/mit-b5微調的圖像分割模型，專注於裂縫檢測任務

Segformer B4 Crack Segmentation Dataset

基於SegFormer架構的裂縫分割模型，在裂縫分割數據集上微調，用於檢測圖像中的裂縫結構

Transformers 英語

Yolov8s Seg Solar Panels

這是一個基於YOLOv8s架構訓練的實例分割模型，專門用於檢測和分割太陽能板圖像。

Segformer B0 Finetuned Segments Stamp Verification

基於nvidia/mit-b0在郵票驗證數據集上微調的語義分割模型，用於精確分割圖像中的郵票區域

Histo Train Segformer

基於SegFormer架構的圖像分類模型，在imagefolder數據集上微調，準確率達87.5%

BBS-Net是一種用於RGB-D顯著目標檢測的深度學習模型，採用分叉骨幹策略網絡結構，能夠有效處理RGB和深度圖像數據。

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384

基於LiLT和DocLayNet數據集微調的行級別文檔理解模型，支持多語言文檔佈局分析

圖像生成文本

Transformers 支持多種語言

Upernet Convnext Large

UperNet是一個語義分割框架，結合ConvNeXt大型骨幹網絡，用於像素級語義標籤預測。

Transformers 英語

Mask2former Swin Large Mapillary Vistas Semantic

基於Swin骨幹網絡的大規模Mask2Former模型，專為通用圖像分割任務設計，統一處理實例分割、語義分割和全景分割。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase