mangaocr-hoogberta-v2オープンソースモデル - 無料で日本漫画画像のテキスト内容を抽出する

ホーム

Mangaocr Hoogberta V2

dsupaによって開発

TrOCRアーキテクチャに基づく日本語漫画テキスト認識モデルで、漫画画像からテキスト内容を抽出するために特別に設計されています。

画像生成テキスト

Transformers

#漫画テキスト認識 #日本語OCR #高精度文字抽出

ダウンロード数 39

リリース時間 : 4/22/2023

モデル概要

このモデルは視覚エンコーダーとテキストデコーダーを組み合わせており、漫画画像中の日本語テキストを正確に認識でき、漫画翻訳やコンテンツ分析などのシナリオに適しています。

モデル特徴

漫画専用OCR

漫画テキストの特徴に特化して最適化されており、吹き出し文字やアートフォントなどの複雑なレイアウトを処理可能

エンドツーエンド認識

画像から直接テキストを生成し、従来のOCRのような段階的な処理フローが不要

Hoogbertaアーキテクチャ

改良されたTransformerアーキテクチャに基づき、日本語テキスト認識で優れた性能を発揮

モデル能力

漫画テキスト認識

日本語OCR

画像からテキストへ

吹き出し文字抽出

使用事例

漫画翻訳

自動対話テキスト抽出

スキャンした漫画ページから自動的に会話内容を認識

手動入力作業量を大幅に削減可能

コンテンツ分析

漫画コンテンツインデックス

漫画コンテンツの検索可能なテキストデータベースを構築

テキストベースの漫画コンテンツ検索を実現

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Mangaocr Hoogberta V2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Trocr画像テキスト変換モデル

🚀 クイックスタート

💻 使用例

基本的な使用法