Q

Qari OCR 0.1 VL 2B Instruct

由NAMAA-Space開發
基於Qwen2 VL模型微調的阿拉伯語OCR模型,專為整頁阿拉伯文本識別優化
下載量 2,965
發布時間 : 2/28/2025

模型概述

該模型是針對阿拉伯語整頁文本光學字符識別(OCR)任務優化的視覺語言模型,在阿拉伯語OCR數據集上微調,顯著提升了識別準確率

模型特點

高精度阿拉伯語OCR
針對阿拉伯語整頁文本優化的識別能力,WER僅0.068,CER僅0.019
整頁文本處理
專門針對整頁阿拉伯文本識別訓練,能處理完整頁面內容
量化優化
採用4bit量化技術,在保持性能的同時減少資源佔用
特定字體優化
針對Almarai、Amiri、Cairo等常用阿拉伯字體特別優化

模型能力

阿拉伯語印刷體識別
整頁文本提取
高精度字符識別
多字體支持

使用案例

文檔數字化
阿拉伯古籍數字化
將阿拉伯語古籍和手稿轉換為可編輯文本
準確率達98.1%字符識別率
商業文檔處理
處理阿拉伯語合同、發票等商業文檔
較傳統OCR工具提升84%準確率
教育應用
教材數字化
將阿拉伯語教材和學術論文轉換為數字文本
BLEU分數達0.860
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase