🚀 LayoutLM-v3模型在发票数据集上的微调
本模型是 microsoft/layoutlmv3-base 在发票数据集上的微调版本。我们使用在发票数据集上训练的微软 LayoutLMv3 模型来预测开票方名称、开票方地址、开票方邮政编码、到期日期、消费税、发票日期、发票编号、小计和总计。使用时,只需上传一张图片或使用下面的示例图片,结果将在几秒钟内显示。
该模型在评估集上取得了以下结果:
- 损失:0.0012
- 精确率:1.0
- 召回率:1.0
- F1值:1.0
- 准确率:1.0
🚀 快速开始
使用本模型时,只需上传一张图片或使用示例图片,结果将在几秒钟内显示。
✨ 主要特性
- 基于微调的 LayoutLMv3 模型,可准确预测发票的多项关键信息。
- 在评估集上各项指标(精确率、召回率、F1值、准确率)均达到 1.0,表现优异。
📚 详细文档
模型描述
本模型是 microsoft/layoutlmv3-base 在发票数据集上的微调版本。
预期用途与限制
更多信息待补充。
训练和评估数据
所有训练代码可从以下 GitHub 链接获取:
https://github.com/Theivaprakasham/layoutlmv3
该模型可在 HuggingFace Spaces 链接进行评估:
https://huggingface.co/spaces/Theivaprakasham/layoutlmv3_invoice
训练过程
训练超参数
训练期间使用了以下超参数:
- 学习率:1e-05
- 训练批次大小:2
- 评估批次大小:2
- 随机种子:42
- 优化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e-08)
- 学习率调度器类型:线性
- 训练步数:2000
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
精确率 |
召回率 |
F1值 |
准确率 |
无记录 |
2.0 |
100 |
0.0878 |
0.968 |
0.9817 |
0.9748 |
0.9966 |
无记录 |
4.0 |
200 |
0.0241 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
无记录 |
6.0 |
300 |
0.0186 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
无记录 |
8.0 |
400 |
0.0184 |
0.9854 |
0.9574 |
0.9712 |
0.9956 |
0.1308 |
10.0 |
500 |
0.0121 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
0.1308 |
12.0 |
600 |
0.0076 |
0.9939 |
0.9878 |
0.9908 |
0.9987 |
0.1308 |
14.0 |
700 |
0.0047 |
1.0 |
0.9959 |
0.9980 |
0.9996 |
0.1308 |
16.0 |
800 |
0.0036 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.1308 |
18.0 |
900 |
0.0045 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.0069 |
20.0 |
1000 |
0.0043 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.0069 |
22.0 |
1100 |
0.0016 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
24.0 |
1200 |
0.0015 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
26.0 |
1300 |
0.0014 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
28.0 |
1400 |
0.0013 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
30.0 |
1500 |
0.0012 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
32.0 |
1600 |
0.0012 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
34.0 |
1700 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
36.0 |
1800 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
38.0 |
1900 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.002 |
40.0 |
2000 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
框架版本
- Transformers 4.20.0.dev0
- Pytorch 1.11.0+cu113
- Datasets 2.2.2
- Tokenizers 0.12.1
🔧 技术细节
本模型基于 LayoutLMv3 架构,在发票数据集上进行微调。训练过程中使用了特定的超参数和优化器,通过不断迭代训练,最终在评估集上取得了优异的性能。
📄 许可证
文档未提及相关许可证信息。
信息表格
属性 |
详情 |
模型类型 |
LayoutLM-v3 微调模型 |
训练数据 |
发票数据集 |
评估指标 |
精确率、召回率、F1值、准确率 |
评估结果 |
损失:0.0012;精确率:1.0;召回率:1.0;F1值:1.0;准确率:1.0 |