layout-xlm-base-finetuned-with-DocLayNet-base-at-paragraphlevel-ml512开源模型

Home

Layout Xlm Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

Developed by pierreguillou

该模型是基于LayoutXLM基础模型在DocLayNet数据集上微调的版本，专门用于文档布局分析和段落级内容理解。

文字识别

Transformers

Supports Multiple LanguagesOpen Source License:MIT #多语言文档理解 #金融法律文档分析 #段落级布局识别

Downloads 79

Release Time : 3/25/2023

Model Overview

这是一个多语言文档理解模型，能够识别和分析PDF文档中的段落级别元素，如标题、文本、表格、图片等。

Model Features

段落级文档理解

能够识别和分析文档中的段落级别元素，包括标题、文本、表格、图片等11种不同类型

多语言支持

支持英语、德语、法语和日语等多种语言的文档分析

高准确率

在DocLayNet测试集上取得了86.55%的段落准确率和96.93%的标记准确率

Model Capabilities

文档布局分析

段落分类

多语言文档处理

PDF内容理解

Use Cases

金融文档处理

财务报告分析

自动识别财务报告中的不同部分，如表格、文本和标题

准确率高达90%以上

法律文档处理

法律条文解析

识别法律文档中的章节、条款和注释

章节标题识别准确率83.16%

科学文献处理

科学论文解析

识别论文中的公式和图表

公式识别准确率95.33%

训练损失	轮数	步数	准确率	F1值	验证损失	精确率	召回率
无记录	0.11	200	0.8842	0.1066	0.4428	0.1154	0.0991
无记录	0.21	400	0.9243	0.4440	0.3040	0.4548	0.4336
0.7241	0.32	600	0.9359	0.5544	0.2265	0.5330	0.5775
0.7241	0.43	800	0.9479	0.6015	0.2140	0.6013	0.6017
0.2343	0.53	1000	0.9402	0.6132	0.2852	0.6642	0.5695
0.2343	0.64	1200	0.9540	0.6604	0.1694	0.6565	0.6644
0.2343	0.75	1400	0.9354	0.6198	0.2308	0.5119	0.7854
0.1913	0.85	1600	0.9594	0.6590	0.1601	0.7190	0.6082
0.1913	0.96	1800	0.9541	0.6597	0.1671	0.5790	0.7664
0.1346	1.07	2000	0.9612	0.6986	0.1580	0.6838	0.7140
0.1346	1.17	2200	0.9597	0.6897	0.1423	0.6618	0.7200
0.1346	1.28	2400	0.9663	0.6980	0.1580	0.7490	0.6535
0.098	1.39	2600	0.9616	0.6800	0.1394	0.7044	0.6573
0.098	1.49	2800	0.9686	0.7251	0.1756	0.6893	0.7649
0.0999	1.6	3000	0.9636	0.6985	0.1542	0.7127	0.6848
0.0999	1.71	3200	0.9670	0.7097	0.1187	0.7538	0.6705
0.0999	1.81	3400	0.9585	0.7427	0.1793	0.7602	0.7260
0.0972	1.92	3600	0.9621	0.7189	0.1836	0.7576	0.6839
0.0972	2.03	3800	0.9642	0.7189	0.1465	0.7388	0.6999
0.0662	2.13	4000	0.9691	0.7450	0.1409	0.7615	0.7292
0.0662	2.24	4200	0.9615	0.7432	0.1720	0.7435	0.7429
0.0662	2.35	4400	0.9667	0.7338	0.1440	0.7469	0.7212
0.0581	2.45	4600	0.9657	0.7135	0.1928	0.7458	0.6839
0.0581	2.56	4800	0.9692	0.7378	0.1645	0.7467	0.7292
0.0538	2.67	5000	0.9656	0.7619	0.1517	0.7700	0.7541
0.0538	2.77	5200	0.9684	0.7728	0.1676	0.8227	0.7286
0.0538	2.88	5400	0.9725	0.7608	0.1277	0.7865	0.7367
0.0432	2.99	5600	0.9693	0.7784	0.1532	0.7891	0.7681
0.0432	3.09	5800	0.9692	0.7783	0.1701	0.8067	0.7519
0.0272	3.2	6000	0.9732	0.7798	0.1159	0.8072	0.7542
0.0272	3.3	6200	0.9720	0.7797	0.1835	0.7926	0.7672
0.0272	3.41	6400	0.9730	0.7894	0.1481	0.8183	0.7624
0.0274	3.52	6600	0.9686	0.7655	0.1552	0.7958	0.7373
0.0274	3.62	6800	0.9698	0.7724	0.1523	0.8068	0.7407
0.0246	3.73	7000	0.9691	0.7720	0.1673	0.7960	0.7493
0.0246	3.84	7200	0.9688	0.7695	0.1333	0.7986	0.7424
0.0246	3.94	7400	0.1796	0.8062	0.7441	0.7739	0.9693