donut_240202オープンソースドキュメント理解モデル - 無料でデプロイし、構造化ドキュメント情報抽出を支援

ホーム

Donut 240202

Yazawaによって開発

Yazawa/donut-base-sroieをファインチューニングしたドキュメント理解モデルで、構造化ドキュメント情報抽出タスクに適しています

文字認識

Transformers

オープンソースライセンス:MIT #ドキュメント理解 #マルチGPUトレーニング #線形学習率スケジューリング

ダウンロード数 93

リリース時間 : 2/2/2024

モデル概要

このモデルはDonutアーキテクチャに基づくドキュメント理解モデルで、構造化ドキュメント情報抽出タスク向けに特別にファインチューニングされています。

モデル特徴

ドキュメント理解能力

スキャンしたドキュメントや画像中の構造化情報を理解可能

エンドツーエンド処理

OCR前処理不要で、画像入力から直接構造化出力へ

ファインチューニング最適化

特定データセットで最適化され、情報抽出の精度が向上

モデル能力

ドキュメント画像理解

構造化情報抽出

エンドツーエンドドキュメント処理

使用事例

ドキュメント処理

領収書情報抽出

スキャンした領収書から店舗名、日付、金額などの情報を抽出

請求書処理

請求書の主要フィールドを自動認識し構造化出力

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Donut 240202

モデル概要

モデル特徴

モデル能力

使用事例

🚀 donut_2402

📚 ドキュメント

トレーニング手順

トレーニングハイパーパラメータ

フレームワークのバージョン

📄 ライセンス