オープンソースのLayoutLM - Invoicesモデル。請求書などのドキュメントの非連続テキスト認識と質問応答に使用するための無料でのデプロイ

ホーム

Layoutlm Invoices

magorshunovによって開発

LayoutLMアーキテクチャをファインチューニングした文書QAモデルで、請求書などの不連続テキスト認識に特化

テキスト生成画像

Transformers

英語#不連続テキスト認識 #マルチモーダル文書QA #請求書情報抽出

ダウンロード数 145

リリース時間 : 6/16/2023

モデル概要

このモデルは請求書やその他の文書のQAタスクに最適化されたマルチモーダルモデルで、領域を跨いだ不連続テキストを認識可能。従来モデルが苦手とした複数行にわたる住所認識などの課題を解決

モデル特徴

不連続テキスト認識

追加の分類ヘッドにより領域を跨いだ不連続テキストを認識可能。従来モデルが連続テキスト断片しか予測できなかった制限を克服

マルチモーダル処理能力

テキストと視覚情報を統合して文書を理解。請求書などの構造化文書に適応

専門領域最適化

請求書処理シナリオ向けに特別に最適化されており、財務文書処理で優れた性能を発揮

モデル能力

請求書情報抽出

文書視覚QA

複数行テキスト認識

構造化文書理解

使用事例

財務文書処理

請求書番号認識

請求書文書から正確に請求書番号情報を抽出

複数行にわたる不連続住所テキストの認識に成功

購入金額抽出

契約書や請求書から購入金額情報を抽出

文書内の数値情報を正確に認識

文書自動化

文書情報抽出

大量文書からキー情報を自動処理

文書処理効率の向上

項目	詳細
パイプラインタグ	文書質問応答
タグ	layoutlm、文書質問応答、pdf、請求書

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Layoutlm Invoices

モデル概要

モデル特徴

モデル能力

使用事例

🚀 LayoutLM for Invoices

✨ 主な機能

非連続トークンの予測

改善前

改善後

🚀 クイックスタート

📄 ライセンス

👥 開発チーム

関連情報

ウィジェット