# 学術文書処理

PP FormulaNet Plus M
Apache-2.0
PP-FormulaNet_plus-MはPaddleOCRチームによって開発された強化版の数式認識モデルで、中国語数式の認識をサポートし、複雑な数式の処理能力を向上させています。
文字認識 複数言語対応
P
PaddlePaddle
154
0
PP FormulaNet Plus L
Apache-2.0
PP-FormulaNet_plus-LはPaddleOCRチームが開発した強化版の数式認識モデルで、中国語数式の認識をサポートし、最大トークン数が2560に引き上げられ、複雑な数式シーンに適しています。
文字認識 複数言語対応
P
PaddlePaddle
954
0
Im2latex Base
画像からLaTeX数式を生成するVisionEncoderDecoderモデル、Swin TransformerエンコーダーとGPT-2デコーダーアーキテクチャを使用
画像生成テキスト Transformers
I
Matthijs0
56
1
Im2latex
MIT
VisionEncoderDecoderModelをベースとしたモデルで、画像からLaTeX数式を生成するデータセットでファインチューニングされています。
画像生成テキスト Transformers
I
DGurgurov
288
11
Typress Ocr
MIT
Typst数式OCRタスク用に事前学習されたTrOCRモデルで、画像中の数学式をテキスト形式に変換できます。
文字認識 Transformers
T
paran3xus
88
2
Zhen Latex OCR
Apache-2.0
中英語混合LaTeX数式の認識に特化したOCRモデルで、ローカルオフラインCPU推論をサポート
画像生成テキスト Transformers
Z
MixTex
885
31
Pix2text Mfd
MIT
Pix2Textの数式検出(MFD)モデル、画像中の数式を認識する
文字認識 その他
P
breezedeus
1,369
3
Cephalo LaTeX Phi 3 Vision 128k 4b Beta
Apache-2.0
Cephaloはマルチモーダル材料科学に特化した視覚大規模言語モデルシリーズで、現在のバージョンは数学公式画像をLaTeXコードに変換することに特化しています。
画像生成テキスト Transformers
C
lamm-mit
16
0
Texteller
Apache-2.0
TexTellerはViTアーキテクチャに基づくエンドツーエンドの数式認識モデルで、自然画像中の数学式を認識しLaTeX形式の数式に変換できます。
文字認識 Transformers
T
OleehyO
3,806
31
Nougat For Formula
Apache-2.0
Nougat-smallをファインチューニングした数式認識モデルで、画像からLaTeX数式コードを抽出するのに優れています
画像生成テキスト Transformers
N
CuiSiwei
40
5
Texify
Texify は、数式画像やテキストをLaTeX形式に変換するためのOCRツールです。
文字認識 Transformers
T
vikp
206.53k
15
Nougat Latex Base
Apache-2.0
このモデルはNougat-baseをファインチューニングしたLaTeX OCRモデルで、画像からLaTeXコードを生成するために特別に設計されており、数学式画像の認識能力が最適化されています。
画像生成テキスト Transformers 英語
N
Norm
8,523
78
Nougat Small
NougatはDonutアーキテクチャに基づく視覚-言語モデルで、科学PDFをMarkdown形式に変換するために設計されています。
画像生成テキスト Transformers
N
facebook
10.28k
27
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase