オープンソースのflorence_base__mixed__line_bbox__ocrモデル - 2言語対応で歴史的な手書き文字と光学文字を認識可能

ホーム

Florence Base Mixed Line Bbox Ocr

nazounoryuuによって開発

Microsoft Florence-2ベースモデルをファインチューニングした画像からテキストへの変換モデルで、スウェーデン語と英語をサポートし、歴史的手書きテキスト認識と光学文字認識に特化しています。

画像生成テキスト

Safetensors

オープンソースライセンス:MIT #スウェーデン語手書き認識 #多言語OCR #歴史文書処理

ダウンロード数 112

リリース時間 : 5/25/2025

モデル概要

このモデルは画像からテキストへの変換モデルで、主に歴史的手書きテキストの認識と光学文字認識（OCR）に使用され、特にスウェーデン語と英語をサポートします。

モデル特徴

多言語サポート

スウェーデン語と英語のテキスト認識をサポートし、多言語環境に適しています。

歴史的手書きテキスト認識

歴史的手書きテキストの認識に特化して最適化されており、古籍のデジタル化などのアプリケーションに適しています。

光学文字認識（OCR）

画像から印刷または手書きのテキストを抽出でき、文書のデジタル化に適しています。

モデル能力

画像からテキストへ

手書きテキスト認識

光学文字認識

多言語テキスト抽出

使用事例

古籍デジタル化

歴史文書の転写

歴史的手書き文書を編集可能なテキスト形式に変換します。

古籍デジタル化の効率と精度を向上させます。

文書処理

印刷文書OCR

スキャンした印刷文書からテキスト内容を抽出します。

文書管理と検索プロセスを簡素化します。

プロパティ	詳細
ベースモデル	microsoft/Florence-2-base-ft
パイプラインタグ	画像からテキストへの変換
タグ	スウェーデン語、歴史的、HTR、OCR

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Florence Base Mixed Line Bbox Ocr

モデル概要

モデル特徴

モデル能力

使用事例

🚀 画像からテキストへの変換モデル

📄 ライセンス