trocr-base-printedオープンソースOCRモデル - 無料でデプロイし、印刷体テキストを高精度で識別

ホーム

Trocr Base Printed

Xenovaによって開発

TrOCRはTransformerベースのOCRモデルで、印刷テキストの認識に特化しています。

文字認識

Transformers

#印刷OCR #ONNX形式 #ウェブ対応

ダウンロード数 40

リリース時間 : 10/30/2023

モデル概要

TrOCRはTransformerベースのOCRモデルで、画像から印刷テキストを認識するために設計されています。視覚と言語処理能力を組み合わせ、画像内のテキストを編集可能なテキスト形式に効率的に変換できます。

モデル特徴

Transformerアーキテクチャベース

Transformerの強力な能力を活用し、視覚と言語処理を統合して効率的なテキスト認識を実現します。

印刷テキストに最適化

モデルは印刷テキストに最適化されており、様々な印刷文字を正確に認識できます。

Transformers.js互換

モデルはONNX形式に変換されており、ウェブブラウザ上でTransformers.jsライブラリを使用できます。

モデル能力

画像内テキスト認識

印刷テキスト変換

多言語サポート（推論）

使用事例

文書デジタル化

スキャン文書変換

スキャンされた印刷文書を編集可能なテキスト形式に変換します。

文書処理効率を向上させ、手動入力エラーを削減します。

オフィス自動化

請求書認識

請求書の金額、日付などの主要情報を自動認識します。

財務プロセスを簡素化し、データ入力速度を向上させます。

属性	详情
ベースモデル	microsoft/trocr-base-printed
ライブラリ名	transformers.js
パイプラインタグ	画像からテキストへの変換
タグ	trocr

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Trocr Base Printed

モデル概要

モデル特徴

モデル能力

使用事例

🚀 画像からテキストへの変換モデル

🚀 クイックスタート