TrOCR-base-finetune-numbersオープンソースOCRモデル - 画像から無料でテキストコンテンツを正確に抽出

ホーム

Trocr Base Finetune Numbers

ANANDHU-SCTによって開発

TrOCRは、Transformerベースの光学文字認識モデルで、画像からテキストコンテンツを抽出するために使用されます。

画像生成テキスト

Transformers

英語#画像からテキストへ #多言語OCR #高精度認識

ダウンロード数 23

リリース時間 : 4/13/2024

モデル概要

TrOCRは、複雑な前処理ステップを必要とせず、画像から直接テキストを認識できるエンドツーエンドのOCRモデルで、視覚TransformerとテキストTransformerを組み合わせています。

モデル特徴

エンドツーエンド認識

従来のOCRシステムのような複雑な前処理ステップが不要で、画像から直接テキストを認識

Transformerアーキテクチャ

視覚TransformerとテキストTransformerを組み合わせ、強力な特徴抽出能力を提供

高精度

様々な印刷テキスト認識タスクで優れた性能を発揮

モデル能力

画像テキスト認識

印刷文字抽出

多言語テキスト認識

使用事例

文書デジタル化

スキャン文書OCR

スキャンされたPDFや画像ファイルを編集可能なテキストに変換

高精度なテキスト変換

自動化処理

表データ抽出

画像の表から構造化データを自動抽出

手入力エラーの削減

Property	Details
Model Type	Trocr
Tags	trocr, image-to-text

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Trocr Base Finetune Numbers

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Trocr 画像テキスト変換モデル

🚀 クイックスタート

✨ 主な機能