allenai.olmOCR-7B-0225-previewオープンソースモデル - 画像内のテキストを無料で高速に認識し抽出

ホーム

Allenai.olmocr 7B 0225 Preview GGUF

DevQuasarによって開発

olmOCR-7B-0225-preview は AllenAI によって開発されたOCR技術に基づく画像テキストからテキストへの変換モデルで、画像からテキスト内容を抽出・認識することを目的としています。

大規模言語モデル #画像テキスト認識 #大規模言語モデルOCR #多様なシナリオの文書処理

ダウンロード数 239

リリース時間 : 3/6/2025

モデル概要

このモデルは主に画像からテキストを認識・抽出するために使用され、画像中の文字を編集可能なテキストに変換する必要がある様々なシナリオに適用できます。

モデル特徴

高精度テキスト認識

様々な複雑な背景の画像から正確にテキスト内容を認識・抽出できます。

多言語サポート

複数の言語のテキスト認識をサポートし、国際的なアプリケーションシナリオに適しています。

大規模事前学習

7Bパラメータの事前学習モデルに基づいており、強力なテキスト認識能力を備えています。

モデル能力

画像テキスト認識

多言語テキスト抽出

複雑な背景のテキスト処理

使用事例

文書デジタル化

スキャン文書変換

スキャンした紙文書を編集可能な電子テキストに変換します。

文書処理効率を向上させ、手動入力のエラーを減らします。

オフィス自動化

請求書認識

請求書の金額、日付などの重要な情報を自動的に認識します。

財務プロセスを簡素化し、データ入力速度を向上させます。

属性	詳情
モデルタイプ	画像テキスト変換モデル
ベースモデル	allenai/olmOCR-7B-0225-preview
パイプラインタグ	image-text-to-text

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Allenai.olmocr 7B 0225 Preview GGUF

モデル概要

モデル特徴

モデル能力

使用事例

🚀 画像テキスト変換モデル

📚 詳細情報

モデル情報

モデルリンク

💖 支援