T

Trocr Small Stage1

microsoftによって開発
TrOCRはTransformerベースの事前学習光学文字認識モデルで、エンコーダ-デコーダアーキテクチャを採用し、単一行テキスト画像のOCRタスクに適しています。
ダウンロード数 3,713
リリース時間 : 3/2/2022

モデル概要

TrOCRモデルは画像TransformerエンコーダとテキストTransformerデコーダを組み合わせ、画像内のテキストを読み取り可能なテキスト内容に変換できます。

モデル特徴

Transformerベースのアーキテクチャ
先進的なTransformerアーキテクチャを採用し、画像とテキストを処理、DeiTとUniLMの利点を組み合わせています。
事前学習モデル
事前学習済みの重みを提供し、OCRタスクに直接使用したり、基礎モデルとして微調整したりできます。
単一行テキスト認識
単一行テキスト画像の光学文字認識タスクに特化して最適化されています。

モデル能力

画像からテキストへ
光学文字認識
単一行テキスト認識

使用事例

文書デジタル化
スキャン文書認識
スキャンした文書画像を編集可能なテキスト内容に変換
高精度なテキスト変換効果
自動化処理
フォーム処理
フォーム内のテキスト情報を自動認識・抽出
データ処理効率の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase