D

Donut Demo

由katanaml開發
這是一個基於CORD-v2數據集微調的Donut模型,專為圖像轉文本任務設計,平均準確率達到0.901。
下載量 24
發布時間 : 1/18/2023

模型概述

該模型主要用於從圖像中提取文本信息,特別適用於文檔圖像識別和處理任務。

模型特點

高準確率
在CORD-v2數據集上達到0.901的平均準確率
文檔圖像處理
專門針對文檔圖像中的文本提取進行優化
基於Donut架構
利用先進的Donut模型架構進行圖像到文本的轉換

模型能力

文檔圖像識別
文本提取
圖像轉文本

使用案例

文檔處理
收據識別
從收據圖像中提取結構化文本信息
準確率0.901
表格提取
從文檔圖像中識別和提取表格內容
數據錄入自動化
自動錶單處理
將紙質表單轉換為數字數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase