P

PP FormulaNet Plus L

由 PaddlePaddle 开发
PP-FormulaNet_plus-L 是 PaddleOCR 团队开发的增强版公式识别模型,支持中文公式识别,最大标记数提升至2560,适用于复杂公式场景。
下载量 954
发布时间 : 6/6/2025

模型简介

该模型在原有 PP-FormulaNet 基础上通过更丰富的训练数据增强,显著提升了对复杂公式的识别能力,特别优化了中文公式的支持。

模型特点

中文公式支持
新增对中文公式的识别能力,满足更多学术场景需求
复杂公式处理
最大标记数从1024提升至2560,显著增强复杂公式识别性能
数据多样性
训练数据涵盖中文论文、专业书籍、教科书等多源数据,提升泛化能力

模型能力

数学公式识别
学术文档处理
LaTeX代码生成
多语言公式支持

使用案例

学术研究
论文公式提取
从学术论文中自动识别数学公式并转换为LaTeX格式
准确率高达92.22% BLEU得分(英文)
教育
教材数字化
将纸质教材中的数学公式转换为可编辑格式
中文公式识别达90.64% BLEU得分
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase