Lasttestオープンソース日本語テキストOCRツール - 無料で識別、日本漫画シーン用に最適化

ホーム

Lasttest

Superd4によって開発

日本語テキスト専用に設計された光学文字認識ツールで、主に日本の漫画シーン向けに最適化されています。

文字認識

Transformers

日本語オープンソースライセンス:Apache-2.0 #日本語漫画OCR #多方向テキスト認識 #ルビ対応

ダウンロード数 17

リリース時間 : 4/22/2024

モデル概要

視覚エンコーダー・デコーダーフレームワークに基づいて構築された日本語OCRモデルで、特に漫画シーンにおけるテキスト認識能力を最適化しています。

モデル特徴

漫画シーン最適化

日本の漫画特有のレイアウトやフォントスタイルに特化して最適化されています

多方向テキスト認識

縦書きと横書きのテキスト認識を同時にサポート

ルビ対応

ルビ付きの複雑なテキストを認識可能

画像上テキスト処理

画像上に重ねられた文字コンテンツを効果的に処理

フォント互換性

様々なフォントや特殊スタイルに対応

低画質適応

低画質画像のテキスト認識にも対応

モデル能力

日本語テキスト認識

漫画文字抽出

多方向テキスト処理

ルビ解析

画像上テキスト認識

使用事例

漫画デジタル化

漫画翻訳支援

漫画中の日本語テキストを自動抽出し、翻訳作業を支援

漫画翻訳の効率向上

漫画内容分析

漫画中の会話やテキスト内容を抽出して分析

漫画内容研究を支援

文書処理

日本語文書OCR

一般的な日本語印刷文書を認識

汎用日本語OCRとして使用可能

属性	详情
タグ	画像からテキスト変換
データセット	manga109s
ライセンス	Apache-2.0

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Lasttest

モデル概要

モデル特徴

モデル能力

使用事例

🚀 マンガOCR

🚀 クイックスタート

✨ 主な機能

📄 ライセンス