L

Layout Xlm Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

pierreguillouによって開発
このモデルはLayoutXLMベースモデルをDocLayNetデータセットで微調整したバージョンで、ドキュメントレイアウト分析と段落レベルの内容理解に特化しています。
ダウンロード数 79
リリース時間 : 3/25/2023

モデル概要

これは多言語ドキュメント理解モデルで、PDFドキュメント内の段落レベル要素(タイトル、テキスト、表、画像など)を識別・分析できます。

モデル特徴

段落レベルのドキュメント理解
ドキュメント内の段落レベル要素(タイトル、テキスト、表、画像など11種類)を識別・分析可能
多言語サポート
英語、ドイツ語、フランス語、日本語など多言語のドキュメント分析に対応
高精度
DocLayNetテストセットで段落精度86.55%、タグ精度96.93%を達成

モデル能力

ドキュメントレイアウト分析
段落分類
多言語ドキュメント処理
PDF内容理解

使用事例

金融文書処理
財務報告書分析
財務報告書の表、テキスト、タイトルなど異なる部分を自動識別
90%以上の高精度
法律文書処理
法律条文解析
法律文書の章、条項、注釈を識別
章タイトル識別精度83.16%
科学文献処理
科学論文解析
論文内の数式と図表を識別
数式識別精度95.33%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase