I

Im2latex Base

由Matthijs0開發
基於圖像生成LaTeX公式的VisionEncoderDecoder模型,使用Swin Transformer編碼器和GPT-2解碼器架構
下載量 56
發布時間 : 1/14/2025

模型概述

該模型能夠將包含數學公式的圖像轉換為LaTeX代碼,適用於學術文檔、技術報告等場景的公式數字化處理

模型特點

混合架構設計
結合視覺編碼器(Swin Transformer)和文本解碼器(GPT-2)的優勢,有效處理圖像到文本的轉換任務
高精度公式識別
在測試集上達到0.69的BLEU分數,能夠準確識別和轉換複雜的數學公式
可擴展性
支持後續對手寫公式數據進行微調,提升模型在特定場景下的表現

模型能力

圖像識別
數學公式轉換
LaTeX代碼生成

使用案例

學術研究
論文公式數字化
將紙質或PDF文檔中的數學公式轉換為可編輯的LaTeX代碼
提高學術寫作效率,便於公式複用和修改
教育技術
在線學習平臺
幫助學生和教師快速輸入複雜的數學公式
簡化在線數學內容的創作流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase