Layoutlm Invoices
基于LayoutLM架构微调的文档问答模型,专门处理发票等结构化文档
Downloads 100
Release Time : 12/20/2022
Model Overview
该模型是基于多模态LayoutLM架构的微调版本,专门用于处理发票及其他文档的问答任务。支持识别非连续文本序列,在发票数据提取方面表现优异。
Model Features
非连续文本识别
通过额外分类头可预测长距离非连续文本序列,解决了传统模型只能预测连续文本片段的问题
多数据集微调
在专有发票数据集、SQuAD2.0和DocVQA数据集上进行微调,兼具通用问答和文档视觉问答能力
发票专用优化
专门针对发票文档结构进行优化,在发票号码、金额等关键信息提取上表现优异
Model Capabilities
发票信息提取
文档视觉问答
非连续文本识别
结构化文档处理
Use Cases
财务自动化
发票号码提取
从发票文档中准确提取发票号码
成功识别跨行非连续文本
采购金额识别
从合同或发票中提取采购金额信息
准确识别不同格式的金额表示
文档处理
合同关键信息提取
从合同文档中提取关键条款和日期信息
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98