F

Finetune Donut Cord V2.5

由fahmiaziz開發
這是一個基於Donut架構的視覺語言模型,專門針對CORD-V2數據集進行微調,用於文檔圖像轉文本任務。
下載量 97
發布時間 : 9/12/2023

模型概述

該模型能夠從文檔圖像中提取結構化文本信息,特別適用於收據、表格等文檔的自動識別和轉換。

模型特點

高準確率
在CORD-V2數據集上達到90%的準確率
文檔理解
專門針對文檔圖像優化,能處理複雜的文檔佈局
端到端處理
直接從圖像輸入到結構化文本輸出,無需中間處理步驟

模型能力

文檔圖像識別
文本提取
結構化數據轉換
收據信息提取

使用案例

文檔數字化
收據處理
自動從收據圖像中提取商家、日期、金額等信息
準確率90%
表格識別
將紙質表格轉換為結構化電子數據
辦公自動化
文檔歸檔
自動為掃描文檔生成可搜索的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase