Lasttest
L
Lasttest
Superd4によって開発
日本語テキスト専用に設計された光学文字認識ツールで、主に日本の漫画シーン向けに最適化されています。
ダウンロード数 17
リリース時間 : 4/22/2024
モデル概要
視覚エンコーダー・デコーダーフレームワークに基づいて構築された日本語OCRモデルで、特に漫画シーンにおけるテキスト認識能力を最適化しています。
モデル特徴
漫画シーン最適化
日本の漫画特有のレイアウトやフォントスタイルに特化して最適化されています
多方向テキスト認識
縦書きと横書きのテキスト認識を同時にサポート
ルビ対応
ルビ付きの複雑なテキストを認識可能
画像上テキスト処理
画像上に重ねられた文字コンテンツを効果的に処理
フォント互換性
様々なフォントや特殊スタイルに対応
低画質適応
低画質画像のテキスト認識にも対応
モデル能力
日本語テキスト認識
漫画文字抽出
多方向テキスト処理
ルビ解析
画像上テキスト認識
使用事例
漫画デジタル化
漫画翻訳支援
漫画中の日本語テキストを自動抽出し、翻訳作業を支援
漫画翻訳の効率向上
漫画内容分析
漫画中の会話やテキスト内容を抽出して分析
漫画内容研究を支援
文書処理
日本語文書OCR
一般的な日本語印刷文書を認識
汎用日本語OCRとして使用可能
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98