P

PP FormulaNet Plus L

PaddlePaddleによって開発
PP-FormulaNet_plus-LはPaddleOCRチームが開発した強化版の数式認識モデルで、中国語数式の認識をサポートし、最大トークン数が2560に引き上げられ、複雑な数式シーンに適しています。
ダウンロード数 954
リリース時間 : 6/6/2025

モデル概要

このモデルは既存のPP-FormulaNetをベースに、より豊富な学習データで強化され、複雑な数式の認識能力が大幅に向上し、特に中国語数式のサポートが最適化されています。

モデル特徴

中国語数式対応
中国語数式の認識能力が新たに追加され、より多くの学術シーンのニーズを満たします。
複雑な数式処理
最大トークン数が1024から2560に引き上げられ、複雑な数式の認識性能が大幅に向上します。
データの多様性
学習データには中国語論文、専門書、教科書などの多様なデータが含まれ、汎化能力が向上します。

モデル能力

数学数式認識
学術文書処理
LaTeXコード生成
多言語数式サポート

使用事例

学術研究
論文数式抽出
学術論文から自動的に数学数式を認識し、LaTeX形式に変換します。
英語でのBLEUスコアが92.22%に達します。
教育
教材のデジタル化
紙の教材にある数学数式を編集可能な形式に変換します。
中国語数式の認識ではBLEUスコアが90.64%に達します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase