donut_pdf_ocrオープンソースOCRモデル - 無料でPDFドキュメントの高効率なテキスト認識を実現

ホーム

Donut Pdf Ocr

shubh1608によって開発

画像フォルダデータセットで訓練されたOCRモデルで、PDF文書のテキスト認識に使用されます

文字認識

Transformers

#PDF文書OCR #高精度テキスト認識 #画像からテキストへの変換

ダウンロード数 67

リリース時間 : 4/17/2023

モデル概要

このモデルは光学文字認識(OCR)モデルで、PDF文書画像からテキスト内容を抽出するために特別に設計されています。ディープラーニング技術により高精度な文字認識を実現します。

モデル特徴

高精度OCR

評価セットで0.0443の低い損失値を達成し、モデルが高い認識精度を持つことを示しています

エンドツーエンド訓練

モデルはエンドツーエンドの訓練方式を採用し、画像から直接テキストを出力します

PDF文書最適化

PDF文書画像に特化して最適化された訓練を行っています

モデル能力

PDF文書画像テキスト認識

多形式テキスト出力

文書構造分析

使用事例

文書デジタル化

PDF文書変換

スキャンしたPDF文書を編集可能なテキスト形式に変換します

高精度なテキスト変換

オフィス自動化

文書情報抽出

契約書や請求書などの文書から自動的にキー情報を抽出します

データ処理効率の向上

学習損失	エポック	ステップ	検証損失
0.0829	1.0	47	0.1157
0.0184	2.0	94	0.1660
0.0533	3.0	141	0.0765
0.0765	4.0	188	0.0530
0.101	5.0	235	0.0481
0.0936	6.0	282	0.0494
0.1032	7.0	329	0.0524
0.0033	8.0	376	0.0460
0.0185	9.0	423	0.0440
0.0044	10.0	470	0.0443

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Donut Pdf Ocr

モデル概要

モデル特徴

モデル能力

使用事例

🚀 donut_pdf_ocr

🚀 クイックスタート

🔧 技術詳細

学習ハイパーパラメータ

学習結果

フレームワークのバージョン