olmOCR-7B-thai-v2オープンソースOCRモデル - 無料でデプロイし、タイ語テキストを正確に認識し、多言語表をサポート

ホーム

Olmocr 7B Thai V2

Adunによって開発

最適化されたolmOCRモデルで、タイ語テキスト認識の精度向上に特化し、多言語と表形式をサポートします。

文字認識

Safetensors

その他オープンソースライセンス:MIT #タイ語OCR最適化 #多言語文書認識 #高精度表解析

ダウンロード数 917

リリース時間 : 4/21/2025

モデル概要

olmOCRはビジュアル言語モデルに基づくOCRツールで、タイ語の文字と数字の認識能力を強化するために微調整されており、PDFなどの文書からテキストを抽出するのに適しています。

モデル特徴

多言語と表のサポート

複数の言語の文字と表形式の認識をサポートします。

オープンソース特性

モデルの重み、微調整データセット、推論コードを提供し、開発者がカスタム開発を行いやすくします。

高い精度

250Kの文書に基づいて微調整され、認識の精度を保証します。

APIとCLIのサポート

コマンドラインまたはAPI（vLLM、SGlang）で呼び出すことができ、既存のシステムに簡単に統合できます。

モデル能力

タイ語テキスト認識

多言語文字認識

表形式認識

PDFテキスト抽出

使用事例

文書処理

タイ語文書のデジタル化

タイ語のPDF文書を編集可能な純粋なテキストに変換します。

タイ語文字認識の正確率を向上させます。

多言語表認識

複数の言語と表を含む文書から構造化データを抽出します。

複雑な文書形式をサポートします。

属性	详情
モデルタイプ	image-text-to-text
ベースモデル	allenai/olmOCR-7B-0225-preview
ベースモデルの代替	Qwen2-VL-7B-Instruct
GitHub	https://github.com/allenai/olmocr

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Olmocr 7B Thai V2

モデル概要

モデル特徴

モデル能力

使用事例

😃 olmOCRをファインチューニングして、タイ語での性能を向上させる

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

基本情報

問い合わせ先

📄 ライセンス