N

Nanonets OCR S GGUF

Mungertによって開発
Nanonets-OCR-sは強力な画像をMarkdownに変換するOCRモデルで、文書を構造化されたMarkdownに変換し、インテリジェントな内容認識と意味的マーキングを行うことができます。
ダウンロード数 1,044
リリース時間 : 6/14/2025

モデル概要

Nanonets-OCR-sは、文書を構造化されたMarkdownに変換するために設計された先進的なOCRモデルです。このモデルは、テキストを抽出するだけでなく、表、数式、画像、署名、透かしなどの複雑な内容を認識してマーキングすることができ、大規模言語モデル(LLM)の下流処理に非常に適しています。

モデル特徴

LaTeX数式認識
数学の数式を自動的に正しい形式のLaTeX構文に変換し、行内数式と表示数式を区別します。
インテリジェントな画像記述
構造化された<img>タグを使用して文書内の画像を記述し、大規模言語モデルで処理しやすくします。
署名検出と分離
署名を他のテキストから認識して分離し、<signature>タグに出力します。これは法律および商業文書に適しています。
透かし抽出
文書から透かしテキストを検出して抽出し、<watermark>タグに配置します。
インテリジェントなチェックボックス処理
フォームのチェックボックスとラジオボタンを標準化されたUnicode記号(☐, ☑, ☒)に変換し、一貫した信頼性の高い処理を行えるようにします。
複雑な表の抽出
文書から複雑な表を正確に抽出し、MarkdownおよびHTMLの表形式に変換します。

モデル能力

文書変換
テキスト抽出
表認識
数式認識
画像記述
署名検出
透かし抽出
チェックボックス処理

使用事例

文書処理
PDFをMarkdownに変換
PDF文書を構造化されたMarkdown形式に変換し、元の文書のレイアウトと内容を保持します。
処理と編集が容易なMarkdown文書を生成します。
表の抽出
文書から複雑な表を抽出し、HTMLまたはMarkdown形式に変換します。
表の構造と内容を保持し、後続の処理を容易にします。
学術研究
数式認識
文書内の数学の数式を認識し、LaTeX構文に変換します。
学術論文の編集と排版を容易にします。
商業文書
署名検出
文書内の署名部分を認識して分離します。
法律および商業文書の処理を容易にします。
透かし抽出
文書内の透かしテキストを検出して抽出します。
文書の著作権管理と検証を容易にします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase