finetune-donut-cord-v2.5開源模型 - 免費部署文檔圖像精準轉文本

首頁

Finetune Donut Cord V2.5

由fahmiaziz開發

這是一個基於Donut架構的視覺語言模型，專門針對CORD-V2數據集進行微調，用於文檔圖像轉文本任務。

圖像生成文本

Transformers

開源協議:Openrail #文檔圖像轉文本 #高精度OCR #結構化信息提取

下載量 97

發布時間 : 9/12/2023

模型概述

該模型能夠從文檔圖像中提取結構化文本信息，特別適用於收據、表格等文檔的自動識別和轉換。

模型特點

高準確率

在CORD-V2數據集上達到90%的準確率

文檔理解

專門針對文檔圖像優化，能處理複雜的文檔佈局

端到端處理

直接從圖像輸入到結構化文本輸出，無需中間處理步驟

模型能力

文檔圖像識別

文本提取

結構化數據轉換

收據信息提取

使用案例

文檔數字化

收據處理

自動從收據圖像中提取商家、日期、金額等信息

準確率90%

表格識別

將紙質表格轉換為結構化電子數據

辦公自動化

文檔歸檔

自動為掃描文檔生成可搜索的文本內容

屬性	詳情
訓練數據	naver-clova-ix/cord-v2

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Finetune Donut Cord V2.5

模型概述

模型特點

模型能力

使用案例

🚀 圖像轉文本模型微調項目

🚀 快速開始

✨ 主要特性

📚 詳細文檔

數據集信息

評估指標

庫信息

任務類型

📄 許可證