olmOCR-7B-0725-FP8オープンソースドキュメントOCRモデル - 無料でデプロイし、文書内容を高精度に認識

ホーム

Olmocr 7B 0725 FP8

allenaiによって開発

olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。

画像生成テキスト

Transformers

英語オープンソースライセンス:Apache-2.0 #文書画像OCR #FP8量子化 #大規模文書処理

ダウンロード数 881

リリース時間 : 7/22/2025

モデル概要

このモデルは文書画像の文字認識に特化しており、テキストを含む文書画像を処理し、その中の文字内容を抽出することができます。

モデル特徴

FP8量子化

llmcompressorツールを使用して、元のモデルをFP8バージョンに量子化し、推論効率を向上させます。

文書OCR最適化

文書画像に特化して最適化されており、文書内の文字内容を正確に認識することができます。

大規模処理能力

sglangを通じて効率的な推論をサポートし、数百万の文書を処理する大規模なアプリケーションシナリオに適しています。

モデル能力

文書画像文字認識

多言語テキスト抽出

大規模文書処理

使用事例

文書のデジタル化

歴史文書のデジタル化

紙の歴史文書を検索可能なデジタルテキストに変換します。

企業文書処理

企業の大量の契約書、報告書などの文書を自動的に処理します。

教育研究

学術論文分析

スキャンされた学術論文からテキスト内容を抽出して分析します。

プロパティ	詳細
モデルタイプ	olmOCR-7B-0725-FP8
訓練データ	allenai/olmOCR-mix-0225
ベースモデル	Qwen/Qwen2.5-VL-7B-Instruct
ライブラリ名	transformers

Apache-2.0

Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。

Nunchaku Flux.1 Dev Colossus

その他

Colossus Project FluxのNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的としています。このモデルは、推論効率を最適化しながら、性能損失を最小限に抑えます。

画像生成英語

nunchaku-tech

235

Qwen2.5 VL 7B Abliterated Caption It GGUF

Apache-2.0

これはQwen2.5-VL-7Bモデルに基づく静的量子化バージョンで、画像記述生成タスクに特化し、複数の言語をサポートしています。

olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。

Lucy-128kはQwen3 - 1.7Bをベースに開発された、プロキシ型ネットワーク検索と軽量ブラウジングに特化したモデルで、モバイルデバイスでも効率的に動作します。

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Olmocr 7B 0725 FP8

モデル紹介

コンテンツ詳細

代替品

モデル概要

モデル特徴

モデル能力

使用事例

🚀 olmOCR-7B-0725-FP8

クイックリンク

🚀 クイックスタート

📄 ライセンス

おすすめAIモデル