S

Segformer B5 Finetuned IDD L2 V2

由izzako開發
該模型是基於 NVIDIA 的 MIT-B5 架構,在 IDD 20K 語義分割數據集上微調的圖像分割模型,適用於道路場景理解任務。
下載量 29
發布時間 : 3/25/2025

模型概述

SegFormer-B5 是一個高效的語義分割模型,經過在 IDD 20K 數據集上的微調,能夠準確識別道路場景中的多種物體和區域,包括道路、行人、車輛、建築物等。

模型特點

高精度道路場景分割
在 IDD 20K 數據集上微調,能夠準確識別道路、人行道、車輛等多種場景元素。
多類別識別能力
支持識別 20 多種不同的道路場景類別,包括靜態元素(如道路、建築物)和動態元素(如行人、車輛)。
優化的訓練參數
使用 Adam 優化器和線性學習率調度器進行訓練,學習率為 0.0006,訓練輪次為 50。

模型能力

圖像分割
道路場景理解
多類別物體識別

使用案例

自動駕駛
道路場景解析
用於自動駕駛系統中對道路環境的即時理解和分割。
在 IDD 20K 評估集上達到 0.7180 的平均交併比(mIoU)。
智能交通系統
交通元素監測
識別和統計道路上的車輛、行人等交通參與者。
騎行者識別準確率達 0.8434,行人識別準確率達 0.8057。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase