donut-base-sroieオープンソース文書理解モデル - 無料でデプロイして構造化文書情報抽出を実現する

ホーム

Donut Base Sroie

enoreyesによって開発

naver-clova-ix/donut-baseをファインチューニングした文書理解モデルで、構造化文書情報抽出タスクに特化

文字認識

Transformers

オープンソースライセンス:MIT #文書画像理解 #領収書情報抽出 #OCR強化

ダウンロード数 15

リリース時間 : 3/23/2023

モデル概要

このモデルはDonutアーキテクチャに基づく視覚-言語モデルで、スキャン文書から構造化情報を抽出するために特別に設計されています。領収書や請求書などの文書の自動処理に適しています。

モデル特徴

文書理解能力

スキャン文書内のテキストとレイアウト情報を理解可能

エンドツーエンド処理

OCR前処理不要で、画像入力から直接構造化出力へ

ファインチューニング適応

特定の文書タイプ(領収書など)に最適化

モデル能力

文書画像理解

構造化情報抽出

領収書データ処理

請求書情報認識

使用事例

文書自動化

領収書情報抽出

スキャンした領収書から店舗名、日付、金額などの情報を自動抽出

財務記録処理の自動化

請求書処理

請求書の主要フィールドを認識し構造化保存

企業財務プロセスの簡素化

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Donut Base Sroie

モデル概要

モデル特徴

モデル能力

使用事例

🚀 donut-base-sroie

🚀 クイックスタート

🔧 技術詳細

トレーニングハイパーパラメータ

フレームワークバージョン

📄 ライセンス