N

Nanonets OCR S GGUF

unslothによって開発
Nanonets-OCR-sは、画像をMarkdown形式に変換する高度な光学文字認識(OCR)モデルで、文書を構造化されたMarkdown形式に変換し、スマートな内容認識とセマンティックなタグ付け機能を備えています。
ダウンロード数 2,300
リリース時間 : 6/16/2025

モデル概要

Nanonets-OCR-sは強力なOCRモデルで、文書を構造化されたMarkdown形式に変換するために設計されています。テキストを抽出するだけでなく、LaTeX数式、画像、署名、透かしなどの複雑な内容を認識してタグ付けすることができ、大規模言語モデル(LLM)による下流処理に非常に適しています。

モデル特徴

LaTeX数式認識
数学方程式や数式を自動的に正しい形式のLaTeX構文に変換し、行内数式と表示数式を区別できます。
スマート画像記述
構造化された<img>タグを使用して文書内の画像を記述し、大規模言語モデルによる処理を容易にします。
署名検出と分離
文書内の署名を認識して分離し、<signature>タグ内に出力します。
透かし抽出
文書内の透かしテキストを検出して抽出し、<watermark>タグ内に配置します。
スマートチェックボックス処理
フォーム内のチェックボックスとラジオボタンを標準化されたUnicode記号に変換します。
複雑な表の抽出
文書内の複雑な表を正確に抽出し、MarkdownとHTMLの表形式に変換します。

モデル能力

文書OCR
LaTeX数式認識
画像内容記述
署名検出
透かし抽出
表抽出
チェックボックス処理

使用事例

文書処理
学術論文の処理
数学公式と表を含む学術論文を構造化Markdown形式に変換します。
元の文書の構造とセマンティクスを保持し、後続の分析と処理を容易にします。
商業契約書の処理
契約書内のテキスト、署名、透かし情報を抽出します。
法律文書を自動化処理し、効率を向上させます。
フォームの処理
フォーム内のチェックボックスとラジオボタンを認識して変換します。
フォームデータを標準化し、後続の分析を容易にします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase