# 學術文檔處理

PP FormulaNet Plus M
Apache-2.0
PP-FormulaNet_plus-M 是由 PaddleOCR 團隊開發的增強版公式識別模型,支持中文公式識別,並提升了對複雜公式的處理能力。
文字識別 支持多種語言
P
PaddlePaddle
154
0
PP FormulaNet Plus L
Apache-2.0
PP-FormulaNet_plus-L 是 PaddleOCR 團隊開發的增強版公式識別模型,支持中文公式識別,最大標記數提升至2560,適用於複雜公式場景。
文字識別 支持多種語言
P
PaddlePaddle
954
0
Im2latex Base
基於圖像生成LaTeX公式的VisionEncoderDecoder模型,使用Swin Transformer編碼器和GPT-2解碼器架構
圖像生成文本 Transformers
I
Matthijs0
56
1
Im2latex
MIT
基於VisionEncoderDecoderModel的基準模型,針對從圖像生成LaTeX公式的數據集進行了微調。
圖像生成文本 Transformers
I
DGurgurov
288
11
Typress Ocr
MIT
一個預訓練的TrOCR模型,專門用於Typst公式OCR任務,能夠將圖像中的數學公式轉換為文本格式。
文字識別 Transformers
T
paran3xus
88
2
Zhen Latex OCR
Apache-2.0
一個專注於識別中英文混合LaTeX公式的OCR模型,支持本地離線CPU推理
圖像生成文本 Transformers
Z
MixTex
885
31
Pix2text Mfd
MIT
Pix2Text的數學公式檢測(MFD)模型,用於識別圖片中的數學公式
文字識別 其他
P
breezedeus
1,369
3
Cephalo LaTeX Phi 3 Vision 128k 4b Beta
Apache-2.0
Cephalo是一個專注於多模態材料科學的視覺大語言模型系列,當前版本專精於將數學公式圖像轉換為LaTeX代碼。
圖像生成文本 Transformers
C
lamm-mit
16
0
Texteller
Apache-2.0
TexTeller是基於ViT架構的端到端公式識別模型,能夠識別自然圖像中的數學公式並將其轉換為LaTeX格式公式。
文字識別 Transformers
T
OleehyO
3,806
31
Nougat For Formula
Apache-2.0
基於Nougat-small微調的數學公式識別模型,擅長從圖像中提取LaTeX公式代碼
圖像生成文本 Transformers
N
CuiSiwei
40
5
Texify
Texify 是一個 OCR 工具,專門用於將公式圖片和文本轉換為 LaTeX 格式。
文字識別 Transformers
T
vikp
206.53k
15
Nougat Latex Base
Apache-2.0
該模型是基於Nougat-base微調的LaTeX OCR模型,專門用於從圖像生成LaTeX代碼,特別優化了數學公式圖像的識別能力。
圖像生成文本 Transformers 英語
N
Norm
8,523
78
Nougat Small
Nougat是基於Donut架構的視覺-語言模型,專為將科學PDF轉換為Markdown格式而設計。
圖像生成文本 Transformers
N
facebook
10.28k
27
Nougat Base
Nougat是基於Donut架構的模型,專為將科學PDF轉錄為易用Markdown格式而訓練
圖像生成文本 Transformers
N
facebook
8,151
164
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase