Trocr Base Printed
TrOCRはTransformerベースのOCRモデルで、印刷テキストの認識に特化しています。
ダウンロード数 40
リリース時間 : 10/30/2023
モデル概要
TrOCRはTransformerベースのOCRモデルで、画像から印刷テキストを認識するために設計されています。視覚と言語処理能力を組み合わせ、画像内のテキストを編集可能なテキスト形式に効率的に変換できます。
モデル特徴
Transformerアーキテクチャベース
Transformerの強力な能力を活用し、視覚と言語処理を統合して効率的なテキスト認識を実現します。
印刷テキストに最適化
モデルは印刷テキストに最適化されており、様々な印刷文字を正確に認識できます。
Transformers.js互換
モデルはONNX形式に変換されており、ウェブブラウザ上でTransformers.jsライブラリを使用できます。
モデル能力
画像内テキスト認識
印刷テキスト変換
多言語サポート(推論)
使用事例
文書デジタル化
スキャン文書変換
スキャンされた印刷文書を編集可能なテキスト形式に変換します。
文書処理効率を向上させ、手動入力エラーを削減します。
オフィス自動化
請求書認識
請求書の金額、日付などの主要情報を自動認識します。
財務プロセスを簡素化し、データ入力速度を向上させます。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98