T

Trocr Small Photomath

由vukpetar開發
TrOCR是基於Transformer的光學字符識別模型,專為數學表達式識別微調,採用編碼器-解碼器架構,結合BEiT圖像編碼器和RoBERTa文本解碼器。
下載量 389
發布時間 : 3/2/2022

模型概述

該模型用於單行文本圖像的光學字符識別(OCR),特別針對數學表達式進行了優化。

模型特點

數學表達式專用
針對數學表達式識別進行專門微調,適合處理公式和符號
Transformer架構
採用先進的Transformer架構,結合視覺和語言處理能力
預訓練模型微調
基於BEiT和RoBERTa預訓練模型,具有強大的遷移學習能力

模型能力

單行文本識別
數學表達式識別
圖像到文本轉換

使用案例

教育技術
數學作業批改
自動識別學生手寫或打印的數學公式
提高批改效率,減少人工錯誤
文檔數字化
科技論文處理
將包含數學公式的紙質文檔轉換為可編輯文本
便於文檔檢索和內容分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase