🚀 LayoutLM-v3模型在發票數據集上的微調
本模型是 microsoft/layoutlmv3-base 在發票數據集上的微調版本。我們使用在發票數據集上訓練的微軟 LayoutLMv3 模型來預測開票方名稱、開票方地址、開票方郵政編碼、到期日期、消費稅、發票日期、發票編號、小計和總計。使用時,只需上傳一張圖片或使用下面的示例圖片,結果將在幾秒鐘內顯示。
該模型在評估集上取得了以下結果:
- 損失:0.0012
- 精確率:1.0
- 召回率:1.0
- F1值:1.0
- 準確率:1.0
🚀 快速開始
使用本模型時,只需上傳一張圖片或使用示例圖片,結果將在幾秒鐘內顯示。
✨ 主要特性
- 基於微調的 LayoutLMv3 模型,可準確預測發票的多項關鍵信息。
- 在評估集上各項指標(精確率、召回率、F1值、準確率)均達到 1.0,表現優異。
📚 詳細文檔
模型描述
本模型是 microsoft/layoutlmv3-base 在發票數據集上的微調版本。
預期用途與限制
更多信息待補充。
訓練和評估數據
所有訓練代碼可從以下 GitHub 鏈接獲取:
https://github.com/Theivaprakasham/layoutlmv3
該模型可在 HuggingFace Spaces 鏈接進行評估:
https://huggingface.co/spaces/Theivaprakasham/layoutlmv3_invoice
訓練過程
訓練超參數
訓練期間使用了以下超參數:
- 學習率:1e-05
- 訓練批次大小:2
- 評估批次大小:2
- 隨機種子:42
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e-08)
- 學習率調度器類型:線性
- 訓練步數:2000
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
精確率 |
召回率 |
F1值 |
準確率 |
無記錄 |
2.0 |
100 |
0.0878 |
0.968 |
0.9817 |
0.9748 |
0.9966 |
無記錄 |
4.0 |
200 |
0.0241 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
無記錄 |
6.0 |
300 |
0.0186 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
無記錄 |
8.0 |
400 |
0.0184 |
0.9854 |
0.9574 |
0.9712 |
0.9956 |
0.1308 |
10.0 |
500 |
0.0121 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
0.1308 |
12.0 |
600 |
0.0076 |
0.9939 |
0.9878 |
0.9908 |
0.9987 |
0.1308 |
14.0 |
700 |
0.0047 |
1.0 |
0.9959 |
0.9980 |
0.9996 |
0.1308 |
16.0 |
800 |
0.0036 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.1308 |
18.0 |
900 |
0.0045 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.0069 |
20.0 |
1000 |
0.0043 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.0069 |
22.0 |
1100 |
0.0016 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
24.0 |
1200 |
0.0015 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
26.0 |
1300 |
0.0014 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
28.0 |
1400 |
0.0013 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
30.0 |
1500 |
0.0012 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
32.0 |
1600 |
0.0012 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
34.0 |
1700 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
36.0 |
1800 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
38.0 |
1900 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.002 |
40.0 |
2000 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
框架版本
- Transformers 4.20.0.dev0
- Pytorch 1.11.0+cu113
- Datasets 2.2.2
- Tokenizers 0.12.1
🔧 技術細節
本模型基於 LayoutLMv3 架構,在發票數據集上進行微調。訓練過程中使用了特定的超參數和優化器,通過不斷迭代訓練,最終在評估集上取得了優異的性能。
📄 許可證
文檔未提及相關許可證信息。
信息表格
屬性 |
詳情 |
模型類型 |
LayoutLM-v3 微調模型 |
訓練數據 |
發票數據集 |
評估指標 |
精確率、召回率、F1值、準確率 |
評估結果 |
損失:0.0012;精確率:1.0;召回率:1.0;F1值:1.0;準確率:1.0 |