A

Arabic Base Nougat

由 MohamedRashad 开发
专为阿拉伯语设计的端到端结构化光学字符识别(OCR)系统,基于facebook/nougat-base架构微调
下载量 130
发布时间 : 10/13/2024

模型简介

该模型是一个端到端的结构化阿拉伯语书籍光学字符识别(OCR)系统,能够将阿拉伯语书籍页面图像转换为结构化文本,特别适用于需要Markdown格式的场景。

模型特点

阿拉伯语OCR优化
专门针对阿拉伯语文本进行优化,能够准确识别阿拉伯语书籍页面中的复杂排版和字符
结构化输出
支持生成Markdown格式的结构化文本输出,保留原始文档的格式信息
端到端处理
直接从图像输入到文本输出,无需中间处理步骤

模型能力

阿拉伯语文本识别
英语文本识别
书籍页面图像处理
Markdown格式生成

使用案例

文献数字化
阿拉伯古籍数字化
将印刷版阿拉伯古籍转换为可编辑的数字文本
保留原始排版和格式的结构化文本
教育
教材内容提取
从阿拉伯语教材扫描件中提取教学内容
可编辑的教材文本,便于制作电子教材
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase