trocr-small-koreanオープンソースモデル - 無料で韓国語の画像を簡単にテキスト内容に変換

ホーム

Trocr Small Korean

team-lucidによって開発

TrOCRは視覚エンコーダ-デコーダアーキテクチャに基づく韓国語画像からテキストへの変換モデルで、DeiTを画像エンコーダ、RoBERTaをテキストデコーダとして使用しています。

画像生成テキスト韓国語オープンソースライセンス:Apache-2.0 #韓国語OCR #画像からテキストへ #合成データトレーニング

ダウンロード数 342

リリース時間 : 6/30/2023

モデル概要

このモデルは韓国語画像内のテキストを編集可能なテキスト形式に変換するために特別に設計されており、文書のデジタル化などのシナリオに適しています。

モデル特徴

合成データトレーニング

synthtigerで生成された600万枚の合成画像を使用してトレーニングを行い、多様なテキストシーンをカバーしています。

ハイブリッドアーキテクチャ

DeiT視覚エンコーダとRoBERTaテキストデコーダの利点を組み合わせ、効率的な画像からテキストへの変換を実現しています。

TPU最適化トレーニング

トレーニングプロセスはGoogle TPU研究クラウド(TRC)のサポートを受けており、大規模なトレーニング効率を確保しています。

モデル能力

韓国語テキスト認識

画像からテキストへの変換

文書デジタル化処理

使用事例

文書処理

韓国語文書のデジタル化

スキャンされた韓国語文書や画像を編集可能なテキストに変換

文書処理効率の向上、後続のテキスト分析のサポート

モバイルアプリケーション

韓国語OCRアプリ

モバイルアプリに統合してリアルタイムの韓国語テキスト認識を実現

ユーザーが画像内の韓国語情報を迅速に抽出できるようにする

ハイパーパラメータ	小規模モデルの値
ウォームアップステップ	4,000
学習率	1e - 4
バッチサイズ	512
重み減衰	0.01
最大ステップ数	500,000
学習率減衰	0.1
\(Adam\beta_1\)	0.9
\(Adam\beta_2\)	0.98

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Trocr Small Korean

モデル概要

モデル特徴

モデル能力

使用事例

🚀 trocr-small-korean

🚀 クイックスタート

✨ 主な機能

🔧 技術詳細

学習データ

学習ハイパーパラメータ

📄 ライセンス