layoutlmv3-base-finetuned-funsdオープンソースドキュメントAIモデル - 無料でデプロイしてフォーム理解タスクを実現する

ホーム

Layoutlmv3 Base Finetuned Funsd

HYPJUDYによって開発

LayoutLMv3-baseモデルをFUNSDデータセットでファインチューニングしたドキュメントAIモデルで、フォーム理解タスクに使用されます

文字認識

Transformers

#ドキュメントインテリジェンス分析 #フォーム理解 #高精度OCR

ダウンロード数 329

リリース時間 : 4/18/2022

モデル概要

このモデルはマイクロソフトのLayoutLMv3のファインチューニング版で、ドキュメント画像内のテキストとレイアウト理解に特化しており、特にフォーム理解タスクに適しています。

モデル特徴

統一テキスト画像処理

統一されたテキストと画像マスキング戦略を採用し、ドキュメント内のテキスト内容と視覚的レイアウト情報を同時に処理可能

フォーム理解最適化

FUNSDデータセットでファインチューニングされ、フォームドキュメントの理解能力を特別に最適化

マルチモーダル事前学習

テキスト、レイアウト、画像情報を組み合わせた事前学習により、ドキュメント理解能力を強化

モデル能力

ドキュメント画像理解

フォームフィールド認識

テキストレイアウト分析

ドキュメントエンティティ認識

使用事例

ドキュメント処理

フォーム自動処理

フォーム内のフィールドと内容を自動認識・抽出

FUNSDテストセットで90.59 F1スコアを達成

ドキュメント構造分析

ドキュメントのレイアウト構造とテキスト関係を分析

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Layoutlmv3 Base Finetuned Funsd

モデル概要

モデル特徴

モデル能力

使用事例

🚀 layoutlmv3-base-finetuned-funsd

📄 ライセンス