Olmocr 7B 0725 FP8
O

Olmocr 7B 0725 FP8

allenaiによって開発
olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。
ダウンロード数 881
リリース時間 : 7/22/2025

モデル概要

このモデルは文書画像の文字認識に特化しており、テキストを含む文書画像を処理し、その中の文字内容を抽出することができます。

モデル特徴

FP8量子化
llmcompressorツールを使用して、元のモデルをFP8バージョンに量子化し、推論効率を向上させます。
文書OCR最適化
文書画像に特化して最適化されており、文書内の文字内容を正確に認識することができます。
大規模処理能力
sglangを通じて効率的な推論をサポートし、数百万の文書を処理する大規模なアプリケーションシナリオに適しています。

モデル能力

文書画像文字認識
多言語テキスト抽出
大規模文書処理

使用事例

文書のデジタル化
歴史文書のデジタル化
紙の歴史文書を検索可能なデジタルテキストに変換します。
企業文書処理
企業の大量の契約書、報告書などの文書を自動的に処理します。
教育研究
学術論文分析
スキャンされた学術論文からテキスト内容を抽出して分析します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase