🚀 segformer-b5-finetuned-IDD-L2_v2
本模型是基於 nvidia/mit-b5 在IDD 20K語義分割數據集上進行微調的版本,可用於圖像分割任務,在評估集上取得了優秀的性能表現。

🚀 快速開始
該模型是 nvidia/mit-b5 在IDD 20K語義分割數據集上的微調版本。它在評估集上達到了以下結果:
指標 |
數值 |
損失 |
0.5563 |
平均交併比(Mean Iou) |
0.7180 |
平均準確率(Mean Accuracy) |
0.8224 |
總體準確率(Overall Accuracy) |
0.9083 |
道路準確率(Accuracy Road) |
0.9716 |
停車場準確率(Accuracy Parking) |
0.7949 |
人行道準確率(Accuracy Sidewalk) |
0.8240 |
鐵軌準確率(Accuracy Rail track) |
0.6408 |
行人準確率(Accuracy Person) |
0.8057 |
騎手準確率(Accuracy Rider) |
0.8434 |
摩托車準確率(Accuracy Motorcycle) |
0.8762 |
機動三輪車準確率(Accuracy Autorickshaw) |
0.9451 |
卡車準確率(Accuracy Truck) |
0.9122 |
路緣準確率(Accuracy Curb) |
0.8112 |
圍欄準確率(Accuracy Fence) |
0.5699 |
廣告牌準確率(Accuracy Billboard) |
0.7605 |
電線杆準確率(Accuracy Pole) |
0.6010 |
建築物準確率(Accuracy Building) |
0.8678 |
植被準確率(Accuracy Vegetation) |
0.9495 |
天空準確率(Accuracy Sky) |
0.9841 |
道路交併比(Iou Road) |
0.9391 |
停車場交併比(Iou Parking) |
0.6620 |
人行道交併比(Iou Sidewalk) |
0.6707 |
鐵軌交併比(Iou Rail track) |
0.5025 |
行人交併比(Iou Person) |
0.6726 |
騎手交併比(Iou Rider) |
0.7228 |
摩托車交併比(Iou Motorcycle) |
0.7637 |
機動三輪車交併比(Iou Autorickshaw) |
0.8882 |
卡車交併比(Iou Truck) |
0.8506 |
路緣交併比(Iou Curb) |
0.6721 |
圍欄交併比(Iou Fence) |
0.4571 |
廣告牌交併比(Iou Billboard) |
0.6238 |
電線杆交併比(Iou Pole) |
0.4831 |
建築物交併比(Iou Building) |
0.7293 |
植被交併比(Iou Vegetation) |
0.8792 |
天空交併比(Iou Sky) |
0.9707 |
🔧 技術細節
訓練超參數
在訓練過程中使用了以下超參數:
屬性 |
詳情 |
學習率(learning_rate) |
0.0006 |
訓練批次大小(train_batch_size) |
64 |
評估批次大小(eval_batch_size) |
64 |
隨機種子(seed) |
42 |
優化器(optimizer) |
Adam(betas=(0.9, 0.999),epsilon=1e-08) |
學習率調度器類型(lr_scheduler_type) |
線性(linear) |
訓練輪數(num_epochs) |
50 |
訓練結果
訓練過程中的詳細結果如下表所示:
| 訓練損失 | 輪數 | 步數 | 驗證損失 | 平均交併比 | 平均準確率 | 總體準確率 | 道路準確率 | 停車場準確率 | 人行道準確率 | 鐵軌準確率 | 行人準確率 | 騎手準確率 | 摩托車準確率 | 機動三輪車準確率 | 卡車準確率 | 路緣準確率 | 圍欄準確率 | 廣告牌準確率 | 電線杆準確率 | 建築物準確率 | 植被準確率 | 天空準確率 | 道路交併比 | 停車場交併比 | 人行道交併比 | 鐵軌交併比 | 行人交併比 | 騎手交併比 | 摩托車交併比 | 機動三輪車交併比 | 卡車交併比 | 路緣交併比 | 圍欄交併比 | 廣告牌交併比 | 電線杆交併比 | 建築物交併比 | 植被交併比 | 天空交併比 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| 0.3096 | 1.0 | 202 | 0.3310 | 0.6476 | 0.7663 | 0.8841 | 0.9538 | 0.7998 | 0.7838 | 0.5755 | 0.6912 | 0.7355 | 0.8445 | 0.9518 | 0.8603 | 0.7173 | 0.3997 | 0.6938 | 0.4456 | 0.8868 | 0.9531 | 0.9690 | 0.9256 | 0.6317 | 0.5876 | 0.4378 | 0.5705 | 0.5911 | 0.6722 | 0.8070 | 0.7758 | 0.6255 | 0.3351 | 0.5507 | 0.3663 | 0.6693 | 0.8551 | 0.9600 |
| 0.2786 | 2.0 | 404 | 0.3369 | 0.6560 | 0.7917 | 0.8774 | 0.8968 | 0.8571 | 0.8009 | 0.5009 | 0.7221 | 0.8105 | 0.8267 | 0.9102 | 0.9216 | 0.8204 | 0.6046 | 0.6927 | 0.5244 | 0.8650 | 0.9354 | 0.9773 | 0.8834 | 0.5556 | 0.5941 | 0.4215 | 0.6054 | 0.6340 | 0.6926 | 0.8403 | 0.7757 | 0.6229 | 0.3671 | 0.5681 | 0.4130 | 0.6967 | 0.8610 | 0.9641 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
框架版本
- Transformers 4.42.4
- Pytorch 2.3.1+cu121
- Datasets 2.19.1
- Tokenizers 0.19.1
📄 許可證
本模型使用的許可證為 other。