D

Donut Base Sroie

由philschmid開發
基於naver-clova-ix/donut-base微調的文檔理解模型,適用於圖像文本提取任務
下載量 185
發布時間 : 9/2/2022

模型概述

該模型是基於Donut架構的文檔理解模型,專門針對圖像中的文本信息提取任務進行了微調。適用於處理包含文本的圖像文檔,如收據、發票等。

模型特點

文檔圖像理解
專門針對文檔圖像(如收據、發票)的文本提取任務優化
基於Transformer架構
採用Donut架構,結合視覺和語言處理能力
端到端處理
直接從圖像輸入到文本輸出,無需中間OCR步驟

模型能力

文檔圖像文本提取
收據信息識別
發票數據抽取

使用案例

商業文檔處理
收據信息提取
從掃描或拍攝的收據中自動提取關鍵信息
發票數據處理
自動識別發票中的金額、日期、供應商等信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase