T

Trocr Small Photomath

vukpetarによって開発
TrOCRはTransformerベースの光学文字認識モデルで、数式認識に特化して微調整されており、エンコーダ-デコーダアーキテクチャを採用し、BEiT画像エンコーダとRoBERTaテキストデコーダを組み合わせています。
ダウンロード数 389
リリース時間 : 3/2/2022

モデル概要

このモデルは単一行テキスト画像の光学文字認識(OCR)に使用され、特に数式に最適化されています。

モデル特徴

数式専用
数式認識に特化して微調整されており、数式や記号の処理に適しています
Transformerアーキテクチャ
先進的なTransformerアーキテクチャを採用し、視覚と言語処理能力を兼ね備えています
事前学習モデルの微調整
BEiTとRoBERTaの事前学習モデルを基にしており、強力な転移学習能力を持っています

モデル能力

単一行テキスト認識
数式認識
画像からテキストへの変換

使用事例

教育技術
数学課題の採点
学生の手書きまたは印刷された数式を自動認識
採点効率の向上、人的ミスの削減
文書デジタル化
科学論文処理
数式を含む紙文書を編集可能なテキストに変換
文書検索と内容分析の容易化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase