A

Arabic Base Nougat

MohamedRashadによって開発
アラビア語向けに設計されたエンドツーエンド構造化光学文字認識(OCR)システム、facebook/nougat-baseアーキテクチャを基にファインチューニング
ダウンロード数 130
リリース時間 : 10/13/2024

モデル概要

このモデルはエンドツーエンドの構造化アラビア語書籍光学文字認識(OCR)システムで、アラビア語書籍ページ画像を構造化テキストに変換でき、特にMarkdown形式が必要なシナリオに適しています。

モデル特徴

アラビア語OCR最適化
アラビア語テキストに特化して最適化されており、アラビア語書籍ページの複雑なレイアウトや文字を正確に認識可能
構造化出力
Markdown形式の構造化テキスト出力をサポートし、元の文書のフォーマット情報を保持
エンドツーエンド処理
画像入力からテキスト出力まで直接処理可能で、中間処理ステップが不要

モデル能力

アラビア語テキスト認識
英語テキスト認識
書籍ページ画像処理
Markdown形式生成

使用事例

文献デジタル化
アラビア古典籍デジタル化
印刷版アラビア古典籍を編集可能なデジタルテキストに変換
元のレイアウトとフォーマットを保持した構造化テキスト
教育
教材内容抽出
アラビア語教材スキャンから教育内容を抽出
電子教材作成に便利な編集可能な教材テキスト
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase