オープンソースのLayoutReaderモデル - PDFまたはOCRのテキストボックスを簡単に読みやすい順序に変換

ホーム

Layoutreader

hantianによって開発

PDFから抽出またはOCRで検出されたテキストボックスを読み取り可能な順序に変換する読書順序予測モデルです。

シーケンスラベリング

Transformers

#PDF読書順序予測 #OCR後処理最適化 #ドキュメント構造解析

ダウンロード数 139.61k

リリース時間 : 2/28/2024

モデル概要

このモデルは主にPDFやOCRから取得したテキストレイアウトを処理し、合理的な読書順序を予測し、ドキュメントの可読性を向上させます。

モデル特徴

読書順序最適化

PDFやOCRから取得したテキストレイアウトを自動的に最適化し、人間の読書習慣に合った順序を生成できます。

多フォーマット対応

PDFから抽出またはOCRで検出されたテキストボックスの処理をサポートし、さまざまな入力フォーマットに対応します。

モデル能力

テキストレイアウト分析

読書順序予測

ドキュメント構造最適化

使用事例

ドキュメント処理

PDFドキュメント再編

スキャンPDF内の乱雑なテキストを読み取り可能な順序に再配置します

PDFドキュメントの可読性と可用性を向上させます

OCR後処理

OCR認識結果のテキスト順序を最適化します

OCR出力を自然な読書順序に近づけます

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Layoutreader

モデル概要

モデル特徴

モデル能力

使用事例

🚀 LayoutReader