N

Nanonets OCR S GGUF

由Mungert開發
Nanonets-OCR-s是一款強大的圖像轉Markdown的OCR模型,能夠將文檔轉換為結構化的Markdown並進行智能內容識別和語義標記。
下載量 1,044
發布時間 : 6/14/2025

模型概述

Nanonets-OCR-s是一款先進的OCR模型,專為將文檔轉換為結構化的Markdown設計。它不僅能夠提取文本,還能識別和標記複雜的內容,如表格、公式、圖像、簽名和水印等,非常適合大語言模型(LLM)的下游處理。

模型特點

LaTeX公式識別
自動將數學公式轉換為格式正確的LaTeX語法,區分行內公式和顯示公式。
智能圖像描述
使用結構化的<img>標籤描述文檔中的圖像,使其易於被大語言模型處理。
簽名檢測與隔離
識別並隔離簽名與其他文本,將其輸出到<signature>標籤中,適用於法律和商業文檔。
水印提取
檢測並從文檔中提取水印文本,將其放置在<watermark>標籤中。
智能複選框處理
將表單複選框和單選按鈕轉換為標準化的Unicode符號(☐, ☑, ☒),以便進行一致且可靠的處理。
複雜表格提取
準確地從文檔中提取複雜表格,並將其轉換為Markdown和HTML表格格式。

模型能力

文檔轉換
文本提取
表格識別
公式識別
圖像描述
簽名檢測
水印提取
複選框處理

使用案例

文檔處理
PDF轉Markdown
將PDF文檔轉換為結構化的Markdown格式,保留原始文檔的佈局和內容。
生成易於處理和編輯的Markdown文檔。
表格提取
從文檔中提取複雜表格並轉換為HTML或Markdown格式。
保留表格的結構和內容,便於後續處理。
學術研究
公式識別
識別文檔中的數學公式並轉換為LaTeX語法。
便於學術論文的編輯和排版。
商業文檔
簽名檢測
識別和隔離文檔中的簽名部分。
便於法律和商業文檔的處理。
水印提取
檢測和提取文檔中的水印文本。
便於文檔的版權管理和驗證。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase