L

Layoutreader

hantianによって開発
PDFから抽出またはOCRで検出されたテキストボックスを読み取り可能な順序に変換する読書順序予測モデルです。
ダウンロード数 139.61k
リリース時間 : 2/28/2024

モデル概要

このモデルは主にPDFやOCRから取得したテキストレイアウトを処理し、合理的な読書順序を予測し、ドキュメントの可読性を向上させます。

モデル特徴

読書順序最適化
PDFやOCRから取得したテキストレイアウトを自動的に最適化し、人間の読書習慣に合った順序を生成できます。
多フォーマット対応
PDFから抽出またはOCRで検出されたテキストボックスの処理をサポートし、さまざまな入力フォーマットに対応します。

モデル能力

テキストレイアウト分析
読書順序予測
ドキュメント構造最適化

使用事例

ドキュメント処理
PDFドキュメント再編
スキャンPDF内の乱雑なテキストを読み取り可能な順序に再配置します
PDFドキュメントの可読性と可用性を向上させます
OCR後処理
OCR認識結果のテキスト順序を最適化します
OCR出力を自然な読書順序に近づけます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase