A

Arabic Large Nougat

由 MohamedRashad 开发
专为阿拉伯语设计的端到端结构化光学字符识别系统,可将书籍页面图像转换为结构化文本(Markdown格式)
下载量 537
发布时间 : 10/18/2024

模型简介

该模型基于新型分词器从头训练,采用基础Nougat架构,适用于阿拉伯文献数字化和印刷材料文本提取等领域。

模型特点

阿拉伯语专用OCR
专门针对阿拉伯语文本优化的光学字符识别系统
结构化输出
能够生成Markdown格式的结构化文本输出
端到端解决方案
直接从图像到文本的完整处理流程,无需中间步骤
书籍处理优化
特别适合处理阿拉伯语书籍页面

模型能力

阿拉伯语文本识别
英语文本识别
书籍页面处理
Markdown格式生成

使用案例

文献数字化
阿拉伯古籍数字化
将印刷版阿拉伯古籍转换为可搜索的数字化文本
保留原始文本结构和格式
教育
教材内容提取
从阿拉伯语教材中提取文本内容用于电子化学习
结构化输出便于后续处理
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase