ドーナツベースのSROIEオープンソース文書理解モデル - 無料ファインチューニングで効率的な文書内容識別をサポート

ホーム

Donut Base Sroie

Prem11100によって開発

philschmid/donut-base-sroieをファインチューニングしたドキュメント理解モデル

文字認識

Transformers

オープンソースライセンス:MIT #ドキュメント理解 #画像からテキストへ #構造化データ抽出

ダウンロード数 13

リリース時間 : 11/3/2022

モデル概要

このモデルはDonutアーキテクチャに基づくドキュメント理解モデルで、SROIEデータセットに特化してファインチューニングされ、画像から構造化情報を抽出するために設計されています。

モデル特徴

ドキュメント画像理解

スキャンしたドキュメントや画像から構造化情報を抽出可能

エンドツーエンド処理

OCR前処理なしで画像入力から直接構造化出力を生成

ファインチューニング最適化

SROIEデータセットに特化して最適化され、レシート情報抽出性能を向上

モデル能力

画像内のテキスト認識

構造化情報抽出

レシート情報解析

エンドツーエンドドキュメント理解

使用事例

ドキュメント処理

レシート情報抽出

スキャンしたレシート画像から店舗名、日付、金額などの情報を自動抽出

表データ抽出

ドキュメント画像から表データを抽出し構造化形式に変換

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Donut Base Sroie

モデル概要

モデル特徴

モデル能力

使用事例

🚀 donut-base-sroie

🚀 クイックスタート

🔧 技術詳細

トレーニングハイパーパラメータ

フレームワークバージョン

📄 ライセンス