L

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

pierreguillouによって開発
これはドキュメント理解モデルで、ドキュメントのレイアウトと内容を分析するために特別に設計されており、段落レベルでのタグ分類タスクを実行します。
ダウンロード数 126
リリース時間 : 2/15/2023

モデル概要

このモデルはLiLTアーキテクチャに基づいており、DocLayNetベースデータセットを使用して段落レベルでファインチューニングされており、ドキュメント内のさまざまな段落タイプ(タイトル、テキスト、表など)を識別できます。

モデル特徴

多言語サポート
モデルは複数言語のドキュメントの理解と分析をサポートします
段落レベル分析
ドキュメント内の異なる段落の機能タイプを識別できます
高精度分類
テストセットで86.34%のF1値を達成

モデル能力

ドキュメントレイアウト分析
段落タイプ識別
多言語ドキュメント処理
タグ分類

使用事例

ドキュメント処理
財務報告書分析
財務報告書の異なる部分(タイトル、本文、表など)を自動的に識別
精度86.34%
科学論文処理
科学論文内の数式、図表、本文内容を分類
数式認識精度97.33%
法律文書処理
法律条文解析
法律文書内の章タイトルと本文内容を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase