D

Dpt Large Ade

由Intel開發
這是一個基於ADE20k數據集微調的密集預測變換器(DPT)模型,用於語義分割任務。
下載量 3,497
發布時間 : 3/2/2022

模型概述

該模型使用視覺變換器(ViT)作為主幹網絡,並在其基礎上添加了用於語義分割的頸部結構和頭部結構,能夠對輸入圖像進行高質量的語義分割。

模型特點

高性能語義分割
在ADE20K數據集上達到了49.02%的mIoU,創造了新的最先進水平。
基於視覺變換器
使用視覺變換器(ViT)作為主幹網絡,結合密集預測變換器(DPT)架構,提供高質量的分割結果。
可微調性
該架構可以在較小的數據集上進行微調,並在這些數據集上也達到了新的最先進水平。

模型能力

圖像語義分割
高分辨率圖像處理
多類別物體識別

使用案例

計算機視覺
場景解析
用於解析複雜場景中的各種物體和背景,適用於自動駕駛、機器人導航等應用。
在ADE20K數據集上達到49.02%的mIoU。
圖像編輯
可用於圖像編輯工具中,幫助用戶快速分離圖像中的不同元素。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase