P

PP FormulaNet Plus L

由PaddlePaddle開發
PP-FormulaNet_plus-L 是 PaddleOCR 團隊開發的增強版公式識別模型,支持中文公式識別,最大標記數提升至2560,適用於複雜公式場景。
下載量 954
發布時間 : 6/6/2025

模型概述

該模型在原有 PP-FormulaNet 基礎上通過更豐富的訓練數據增強,顯著提升了對複雜公式的識別能力,特別優化了中文公式的支持。

模型特點

中文公式支持
新增對中文公式的識別能力,滿足更多學術場景需求
複雜公式處理
最大標記數從1024提升至2560,顯著增強複雜公式識別性能
數據多樣性
訓練數據涵蓋中文論文、專業書籍、教科書等多源數據,提升泛化能力

模型能力

數學公式識別
學術文檔處理
LaTeX代碼生成
多語言公式支持

使用案例

學術研究
論文公式提取
從學術論文中自動識別數學公式並轉換為LaTeX格式
準確率高達92.22% BLEU得分(英文)
教育
教材數字化
將紙質教材中的數學公式轉換為可編輯格式
中文公式識別達90.64% BLEU得分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase