manga-ocr-baseオープンソースOCRツール - 日本漫画の日本語テキストを精度よく識別

ホーム

Manga Ocr Base

kha-whiteによって開発

日本語テキスト専用に設計された光学文字認識ツールで、主に日本の漫画シーン向けに最適化されています。

文字認識

Transformers

日本語オープンソースライセンス:Apache-2.0 #日本語漫画認識 #縦横テキスト互換性 #ルビ処理

ダウンロード数 130.36k

リリース時間 : 3/2/2022

モデル概要

視覚エンコーダー-デコーダーフレームワークに基づいて構築された日本語OCRモデルで、特に漫画シーンにおけるテキスト認識能力を最適化しています。

モデル特徴

多方向テキスト認識

縦書きと横書きのテキスト認識を同時にサポート

ルビ処理

ルビ付きテキストを完璧に処理

複雑な背景適応

複雑な背景画像から正確に文字を抽出可能

フォント互換性の高さ

様々なフォントスタイルの変化に対応

低画質適応

低画質画像シーンにも適応

モデル能力

日本語テキスト認識

漫画文字抽出

多方向テキスト処理

ルビ付きテキスト解析

使用事例

漫画デジタル化

漫画翻訳支援

漫画中の日本語テキストを自動抽出し、翻訳作業を容易にする

翻訳効率向上、手入力ミスの削減

漫画内容分析

漫画テキストを一括抽出して内容分析に利用

大規模な漫画内容研究を支援

汎用OCRアプリケーション

日本語文書デジタル化

印刷体日本語文書を編集可能なテキストに変換

文書処理効率の向上

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Manga Ocr Base

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Manga OCR

🚀 クイックスタート

✨ 主な機能

📄 ライセンス