學術文檔處理

# 學術文檔處理

PP FormulaNet Plus M

PP-FormulaNet_plus-M 是由 PaddleOCR 團隊開發的增強版公式識別模型，支持中文公式識別，並提升了對複雜公式的處理能力。

文字識別支持多種語言

PP FormulaNet Plus L

PP-FormulaNet_plus-L 是 PaddleOCR 團隊開發的增強版公式識別模型，支持中文公式識別，最大標記數提升至2560，適用於複雜公式場景。

文字識別支持多種語言

基於圖像生成LaTeX公式的VisionEncoderDecoder模型，使用Swin Transformer編碼器和GPT-2解碼器架構

圖像生成文本

基於VisionEncoderDecoderModel的基準模型，針對從圖像生成LaTeX公式的數據集進行了微調。

圖像生成文本

一個預訓練的TrOCR模型，專門用於Typst公式OCR任務，能夠將圖像中的數學公式轉換為文本格式。

一個專注於識別中英文混合LaTeX公式的OCR模型，支持本地離線CPU推理

圖像生成文本

Pix2Text的數學公式檢測(MFD)模型，用於識別圖片中的數學公式

文字識別其他

Cephalo LaTeX Phi 3 Vision 128k 4b Beta

Cephalo是一個專注於多模態材料科學的視覺大語言模型系列，當前版本專精於將數學公式圖像轉換為LaTeX代碼。

圖像生成文本

TexTeller是基於ViT架構的端到端公式識別模型，能夠識別自然圖像中的數學公式並將其轉換為LaTeX格式公式。

Nougat For Formula

基於Nougat-small微調的數學公式識別模型，擅長從圖像中提取LaTeX公式代碼

圖像生成文本

Texify 是一個 OCR 工具，專門用於將公式圖片和文本轉換為 LaTeX 格式。

Nougat Latex Base

該模型是基於Nougat-base微調的LaTeX OCR模型，專門用於從圖像生成LaTeX代碼，特別優化了數學公式圖像的識別能力。

圖像生成文本

Transformers 英語

Nougat是基於Donut架構的視覺-語言模型，專為將科學PDF轉換為Markdown格式而設計。

圖像生成文本

Nougat是基於Donut架構的模型，專為將科學PDF轉錄為易用Markdown格式而訓練

圖像生成文本

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase