A

Arabic Small Nougat

由MohamedRashad開發
專為阿拉伯語設計的端到端結構化光學字符識別系統,基於facebook/nougat-small架構微調
下載量 1,149
發布時間 : 2/17/2024

模型概述

該模型是一個端到端的阿拉伯語書籍結構化OCR系統,能夠將阿拉伯語書籍圖像轉換為結構化文本(尤其是Markdown格式)。

模型特點

阿拉伯語OCR優化
專門針對阿拉伯語文本識別進行優化,能夠處理阿拉伯語書籍的複雜排版
結構化輸出
生成Markdown格式的結構化文本,保留原始文檔的格式信息
端到端處理
直接從圖像到文本的完整處理流程,無需中間步驟

模型能力

阿拉伯語文本識別
英語文本識別
書籍圖像處理
Markdown格式生成

使用案例

文獻數字化
阿拉伯古籍數字化
將阿拉伯語古籍圖像轉換為可編輯的數字化文本
實現古籍內容的電子化和可搜索化
印刷材料處理
阿拉伯語書籍掃描
處理掃描的阿拉伯語書籍頁面,提取文本內容
生成結構化的電子書內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase