オープンソースのlayoutlmv3 - cord - nerモデル - 文書理解と固有表現抽出タスクに使用する

Layoutlmv3 Cord Ner

renjithksによって開発

LayoutLMv3-baseをファインチューニングした文書理解モデルで、CORDデータセットにおける固有表現認識タスク専用

ダウンロード数 26

リリース時間 : 5/22/2022

モデル概要

このモデルは文書画像内のテキストから固有表現を認識する専用モデルで、構造化/半構造化文書からのキー情報抽出に適しています

マルチモーダル理解能力

テキスト内容と視覚的レイアウト情報を同時処理し、文書理解精度を向上

高精度エンティティ認識

CORDデータセットで94.8%のF1値を達成し、優れた性能を発揮

エンドツーエンド学習

オリジナル文書画像からエンティティ認識までの完全なプロセスをサポート

文書画像分析

テキストエンティティ認識

構造化情報抽出

マルチモーダル特徴融合

文書処理

領収書情報抽出

スキャンした領収書から店舗名、日付、金額などのキー情報を自動認識

精度97.6%を達成

表データ抽出

複雑な表形式文書から構造化データを抽出

金融自動化

請求書処理

請求書から仕入先、税番号、金額などの情報を自動認識