Q

Qari OCR 0.2.2.1 VL 2B Instruct

NAMAA-Spaceによって開発
Qwen2-VL-2B-Instructをファインチューニングしたアラビア語OCRモデルで、ページ全体のアラビア語テキスト認識に最適化され、発音記号の認識をサポート
ダウンロード数 2,382
リリース時間 : 3/26/2025

モデル概要

このモデルはアラビア語OCRタスクに最適化された視覚言語モデルで、ページ全体のアラビア語テキストを高精度に抽出でき、特に発音記号を含むテキストの認識に優れています。

モデル特徴

卓越した精度
アラビア語OCRタスクでトップレベルの性能指標を達成
発音記号サポート
アラビア語の発音記号(tashkeel)を完全に認識し、様々な発音記号形式に対応
多フォント互換性
複数のアラビア語フォントスタイルをサポート
レイアウト適応
異なるドキュメントレイアウトやフォーマットを処理可能

モデル能力

アラビア語テキスト認識
発音記号認識
多フォント処理
ページ全体ドキュメントOCR

使用事例

ドキュメントデジタル化
古籍デジタル化
アラビア語古籍を編集可能なテキストに変換
原本の発音記号とレイアウトを正確に保持
表処理
アラビア語表ドキュメントを認識
表構造と内容の完全性を保持
教育応用
教材スキャン
アラビア語教材を電子テキストに変換
教育用発音記号を正確に認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase