I

Im2latex

由DGurgurov開發
基於VisionEncoderDecoderModel的基準模型,針對從圖像生成LaTeX公式的數據集進行了微調。
下載量 288
發布時間 : 7/15/2024

模型概述

該模型能夠將包含數學公式的圖像轉換為LaTeX代碼,適用於學術文檔處理和數學公式識別等場景。

模型特點

混合架構
結合視覺編碼器(Swin Transformer)和文本解碼器(GPT-2),有效處理圖像到文本的轉換任務
高精度公式識別
在測試集上達到0.67的BLEU分數,能夠準確識別複雜數學公式
分佈式訓練
使用PyTorch的分佈式數據並行(DDP)進行高效訓練

模型能力

圖像識別
數學公式轉換
LaTeX代碼生成

使用案例

學術研究
論文公式數字化
將掃描文檔或圖片中的數學公式轉換為可編輯的LaTeX代碼
提高學術文檔處理效率
教育輔助工具
幫助學生和教師快速獲取圖片中公式的LaTeX表示
便於數學內容共享和教學
文檔處理
PDF公式提取
從PDF文檔中提取公式圖像並轉換為可編輯格式
簡化文檔編輯流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase