A

Arabic Base Nougat

由MohamedRashad開發
專為阿拉伯語設計的端到端結構化光學字符識別(OCR)系統,基於facebook/nougat-base架構微調
下載量 130
發布時間 : 10/13/2024

模型概述

該模型是一個端到端的結構化阿拉伯語書籍光學字符識別(OCR)系統,能夠將阿拉伯語書籍頁面圖像轉換為結構化文本,特別適用於需要Markdown格式的場景。

模型特點

阿拉伯語OCR優化
專門針對阿拉伯語文本進行優化,能夠準確識別阿拉伯語書籍頁面中的複雜排版和字符
結構化輸出
支持生成Markdown格式的結構化文本輸出,保留原始文檔的格式信息
端到端處理
直接從圖像輸入到文本輸出,無需中間處理步驟

模型能力

阿拉伯語文本識別
英語文本識別
書籍頁面圖像處理
Markdown格式生成

使用案例

文獻數字化
阿拉伯古籍數字化
將印刷版阿拉伯古籍轉換為可編輯的數字文本
保留原始排版和格式的結構化文本
教育
教材內容提取
從阿拉伯語教材掃描件中提取教學內容
可編輯的教材文本,便於製作電子教材
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase