Q

Qwen2 VL 2B OCR

由JackChew開發
Qwen2-VL-2B-OCR是基於unsloth/Qwen2-VL-2B-Instruct微調的OCR模型,專注於從文檔、表格和工資單圖像中提取完整文本。
下載量 842
發布時間 : 12/28/2024

模型概述

該模型專門針對光學字符識別(OCR)任務進行了優化,能夠從各種文檔(如工資單、發票和表格)中準確提取文本,確保信息不遺漏。

模型特點

完整文本提取
專注於從文檔中提取所有文本,確保不遺漏任何關鍵信息。
高效微調
使用Unsloth框架和Huggingface的TRL庫進行微調,訓練速度提升2倍。
優化OCR性能
針對工資單、表格等結構化文檔的文本提取進行了專門優化。

模型能力

圖像文本提取
結構化文檔處理
工資單數據分析
表格數據提取

使用案例

金融
工資單處理
從工資單圖像中提取員工信息、收入和扣除項等完整數據。
顯著改進扣除部分的提取,確保信息完整。
文檔管理
發票處理
從發票圖像中提取供應商、金額和日期等關鍵信息。
準確提取結構化數據,減少人工錄入錯誤。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase