manga - ocr - baseオープンソースモデル - 日本漫画の日本語テキストを無料で識別

ホーム

Manga Ocr Base

TareHimselfによって開発

日本漫画の日本語テキストに特化した光学文字認識モデル

文字認識

Transformers

日本語オープンソースライセンス:Apache-2.0 #日本語漫画OCR #画像からテキストへ #日本漫画専用

ダウンロード数 96

リリース時間 : 9/14/2023

モデル概要

このモデルは日本漫画中の日本語テキスト認識に特化しており、画像からテキスト内容を抽出できます。

モデル特徴

漫画テキスト認識

日本漫画の日本語テキストに最適化されており、漫画中の文字内容を正確に認識できます。

多言語サポート

主に日本語を対象としていますが、他の言語のテキスト認識も可能かもしれません（要検証）。

モデル能力

画像からテキストへ

日本語テキスト認識

漫画内容解析

使用事例

デジタル漫画処理

漫画翻訳

漫画中の日本語テキストを自動抽出し、翻訳作業を容易にします。

翻訳効率を向上させ、手動でのテキスト入力作業を軽減します。

漫画内容索引

漫画画像からテキスト内容を抽出し、検索可能な索引データベースを構築します。

ユーザーが特定の漫画内容を迅速に検索できるようになります。

学術研究

漫画言語分析

漫画で使用される言語の特徴や表現方法を研究するために使用します。

言語学や文化研究にデータサポートを提供します。

属性	詳情
タグ	画像からテキストへの変換
訓練データセット	manga109s
複製元	kha-white/manga-ocr-base

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Manga Ocr Base

モデル概要

モデル特徴

モデル能力

使用事例

🚀 マンガOCR光学文字認識

🚀 クイックスタート

📄 ライセンス