A

Arabic Small Nougat

Developed by MohamedRashad
アラビア語専用に設計されたエンドツーエンド構造化光学文字認識システム、facebook/nougat-smallアーキテクチャを基にファインチューニング
Downloads 1,149
Release Time : 2/17/2024

Model Overview

このモデルはアラビア語書籍の構造化OCRシステムで、アラビア語書籍画像を構造化テキスト(特にMarkdown形式)に変換できます。

Model Features

アラビア語OCR最適化
アラビア語テキスト認識に特化して最適化され、アラビア語書籍の複雑な組版を処理可能
構造化出力
Markdown形式の構造化テキストを生成し、元の文書のフォーマット情報を保持
エンドツーエンド処理
画像からテキストへの完全な処理フローを直接実現、中間ステップ不要

Model Capabilities

アラビア語テキスト認識
英語テキスト認識
書籍画像処理
Markdown形式生成

Use Cases

文献デジタル化
アラビア古典籍デジタル化
アラビア語古典籍画像を編集可能なデジタルテキストに変換
古典籍内容の電子化と検索可能化を実現
印刷材料処理
アラビア語書籍スキャン
スキャンしたアラビア語書籍ページを処理し、テキスト内容を抽出
構造化された電子書籍コンテンツを生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase