trocr-base-ruオープンソースOCRモデル - 無料でロシア語と英語の手書きおよび印刷体のテキストを認識する

ホーム

Trocr Base Ru

raxtemurによって開発

microsoft/trocr-base-handwrittenをファインチューニングしたロシア語と英語のOCRモデルで、手書きと印刷テキストの認識に特化

文字認識

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #ロシア語・英語OCR #手書き文字認識 #多言語テキスト抽出

ダウンロード数 977

リリース時間 : 2/16/2024

モデル概要

TrOCR-Ruはマイクロソフトのベースモデルをファインチューニングしたロシア語/英語光学文字認識(OCR)モデルで、画像からテキスト内容を抽出するために特別に設計されており、手書きと印刷テキストの認識をサポートします。

モデル特徴

多言語サポート

ロシア語と英語のテキスト認識を同時にサポート

混合データトレーニング

大規模な合成データセットと実データを混合してトレーニング

高性能OCR

複数のテストセットで安定した認識精度を発揮

モデル能力

画像内のテキスト認識

手書き文字認識

印刷テキスト認識

ロシア語テキスト抽出

英語テキスト抽出

使用事例

文書デジタル化

手書きメモのデジタル化

手書きのロシア語または英語のメモを編集可能なテキストに変換

約70%の精度

フォーム処理

表データ抽出

スキャンした表やフォームから構造化データを抽出

指標	HKR_val	HKR_test1	HKR_test2	CYR_val	CYR_test
正解率 (Accuracy)	69.9947	67.4184	69.9187	72.3613	63.9249
文字誤り率 (CER)	6.7964	8.9113	6.7278	6.6403	9.2576
単語誤り率 (WER)	21.6688	27.3849	21.6200	27.6715	33.2406

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Trocr Base Ru

モデル概要

モデル特徴

モデル能力

使用事例

🚀 TrOCR-Ruのモデルカード

📚 詳細ドキュメント

データセット

評価指標

最終更新日

📄 ライセンス