Donut Invoices
基於Donut架構微調的發票信息提取模型,免OCR實現文檔理解
下載量 70
發布時間 : 5/24/2023
模型概述
該模型針對發票處理場景進行優化,能夠自動從發票中提取供應商信息、賬單明細、金額等關鍵字段,無需依賴OCR技術。
模型特點
免OCR處理
直接處理圖像輸入,無需傳統OCR預處理步驟
發票專用優化
針對發票文檔結構進行專門微調,提升關鍵字段提取準確率
端到端訓練
從圖像到結構化數據的端到端訓練流程
模型能力
發票圖像理解
結構化信息提取
關鍵字段識別
文檔佈局分析
使用案例
財務自動化
應付賬款處理
自動從供應商發票中提取賬單信息,加速應付賬款流程
減少人工數據錄入錯誤,提高處理效率
費用報銷審核
解析員工提交的發票,自動提取金額、日期等關鍵信息
簡化報銷流程,提高審核準確性
文檔數字化
歷史發票歸檔
將紙質發票數字化並提取結構化數據
便於後續檢索和分析
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98