🚀 segformer-b5-finetuned-IDD-L2_v2
本模型是基于 nvidia/mit-b5 在IDD 20K语义分割数据集上进行微调的版本,可用于图像分割任务,在评估集上取得了优秀的性能表现。

🚀 快速开始
该模型是 nvidia/mit-b5 在IDD 20K语义分割数据集上的微调版本。它在评估集上达到了以下结果:
指标 |
数值 |
损失 |
0.5563 |
平均交并比(Mean Iou) |
0.7180 |
平均准确率(Mean Accuracy) |
0.8224 |
总体准确率(Overall Accuracy) |
0.9083 |
道路准确率(Accuracy Road) |
0.9716 |
停车场准确率(Accuracy Parking) |
0.7949 |
人行道准确率(Accuracy Sidewalk) |
0.8240 |
铁轨准确率(Accuracy Rail track) |
0.6408 |
行人准确率(Accuracy Person) |
0.8057 |
骑手准确率(Accuracy Rider) |
0.8434 |
摩托车准确率(Accuracy Motorcycle) |
0.8762 |
机动三轮车准确率(Accuracy Autorickshaw) |
0.9451 |
卡车准确率(Accuracy Truck) |
0.9122 |
路缘准确率(Accuracy Curb) |
0.8112 |
围栏准确率(Accuracy Fence) |
0.5699 |
广告牌准确率(Accuracy Billboard) |
0.7605 |
电线杆准确率(Accuracy Pole) |
0.6010 |
建筑物准确率(Accuracy Building) |
0.8678 |
植被准确率(Accuracy Vegetation) |
0.9495 |
天空准确率(Accuracy Sky) |
0.9841 |
道路交并比(Iou Road) |
0.9391 |
停车场交并比(Iou Parking) |
0.6620 |
人行道交并比(Iou Sidewalk) |
0.6707 |
铁轨交并比(Iou Rail track) |
0.5025 |
行人交并比(Iou Person) |
0.6726 |
骑手交并比(Iou Rider) |
0.7228 |
摩托车交并比(Iou Motorcycle) |
0.7637 |
机动三轮车交并比(Iou Autorickshaw) |
0.8882 |
卡车交并比(Iou Truck) |
0.8506 |
路缘交并比(Iou Curb) |
0.6721 |
围栏交并比(Iou Fence) |
0.4571 |
广告牌交并比(Iou Billboard) |
0.6238 |
电线杆交并比(Iou Pole) |
0.4831 |
建筑物交并比(Iou Building) |
0.7293 |
植被交并比(Iou Vegetation) |
0.8792 |
天空交并比(Iou Sky) |
0.9707 |
🔧 技术细节
训练超参数
在训练过程中使用了以下超参数:
属性 |
详情 |
学习率(learning_rate) |
0.0006 |
训练批次大小(train_batch_size) |
64 |
评估批次大小(eval_batch_size) |
64 |
随机种子(seed) |
42 |
优化器(optimizer) |
Adam(betas=(0.9, 0.999),epsilon=1e-08) |
学习率调度器类型(lr_scheduler_type) |
线性(linear) |
训练轮数(num_epochs) |
50 |
训练结果
训练过程中的详细结果如下表所示:
| 训练损失 | 轮数 | 步数 | 验证损失 | 平均交并比 | 平均准确率 | 总体准确率 | 道路准确率 | 停车场准确率 | 人行道准确率 | 铁轨准确率 | 行人准确率 | 骑手准确率 | 摩托车准确率 | 机动三轮车准确率 | 卡车准确率 | 路缘准确率 | 围栏准确率 | 广告牌准确率 | 电线杆准确率 | 建筑物准确率 | 植被准确率 | 天空准确率 | 道路交并比 | 停车场交并比 | 人行道交并比 | 铁轨交并比 | 行人交并比 | 骑手交并比 | 摩托车交并比 | 机动三轮车交并比 | 卡车交并比 | 路缘交并比 | 围栏交并比 | 广告牌交并比 | 电线杆交并比 | 建筑物交并比 | 植被交并比 | 天空交并比 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| 0.3096 | 1.0 | 202 | 0.3310 | 0.6476 | 0.7663 | 0.8841 | 0.9538 | 0.7998 | 0.7838 | 0.5755 | 0.6912 | 0.7355 | 0.8445 | 0.9518 | 0.8603 | 0.7173 | 0.3997 | 0.6938 | 0.4456 | 0.8868 | 0.9531 | 0.9690 | 0.9256 | 0.6317 | 0.5876 | 0.4378 | 0.5705 | 0.5911 | 0.6722 | 0.8070 | 0.7758 | 0.6255 | 0.3351 | 0.5507 | 0.3663 | 0.6693 | 0.8551 | 0.9600 |
| 0.2786 | 2.0 | 404 | 0.3369 | 0.6560 | 0.7917 | 0.8774 | 0.8968 | 0.8571 | 0.8009 | 0.5009 | 0.7221 | 0.8105 | 0.8267 | 0.9102 | 0.9216 | 0.8204 | 0.6046 | 0.6927 | 0.5244 | 0.8650 | 0.9354 | 0.9773 | 0.8834 | 0.5556 | 0.5941 | 0.4215 | 0.6054 | 0.6340 | 0.6926 | 0.8403 | 0.7757 | 0.6229 | 0.3671 | 0.5681 | 0.4130 | 0.6967 | 0.8610 | 0.9641 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
框架版本
- Transformers 4.42.4
- Pytorch 2.3.1+cu121
- Datasets 2.19.1
- Tokenizers 0.19.1
📄 许可证
本模型使用的许可证为 other。