L

Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384

Developed by pierreguillou
LayoutXLMベースモデルをDocLayNetデータセットで微調整した行レベルドキュメント理解モデルで、多言語ドキュメントのレイアウト分析とマーク分類をサポートします。
Downloads 103
Release Time : 3/2/2023

Model Overview

このモデルはドキュメントのレイアウト分析と理解に特化しており、テキスト、見出し、表などのドキュメント内のさまざまな要素を識別・分類できます。財務報告書、科学論文、法律文書など、さまざまなドキュメントタイプの処理に適しています。

Model Features

多言語サポート
英語、ドイツ語、フランス語、日本語など、複数言語のドキュメント理解をサポートします。
行レベル分析
384トークンブロック(128トークンのオーバーラップ付き)の行レベルで微調整されており、詳細なドキュメント要素の識別を提供します。
高性能マーク分類
DocLayNet評価セットでF1値0.7336、精度0.9373を達成しました。

Model Capabilities

ドキュメントレイアウト分析
マーク分類
多言語テキスト理解
行レベル要素識別

Use Cases

金融ドキュメント処理
財務報告書分析
財務報告書内の表、見出し、本文コンテンツを自動識別します。
財務データ抽出の効率と精度を向上させます。
学術研究
科学論文解析
科学論文から章見出し、図表、参考文献を抽出します。
研究者が論文構造情報を迅速に取得するのを支援します。
法律文書処理
契約条項識別
法律文書内の条項、定義、署名領域を自動マークします。
法律文書レビュープロセスを加速します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase