M

Mangaocr Hoogberta V2

由dsupa開發
一個基於TrOCR架構的日文漫畫文本識別模型,專門用於從漫畫圖像中提取文本內容。
下載量 39
發布時間 : 4/22/2023

模型概述

該模型結合了視覺編碼器和文本解碼器,能夠準確識別漫畫圖像中的日文文本,適用於漫畫翻譯、內容分析等場景。

模型特點

漫畫專用OCR
專門針對漫畫文本特點優化,能處理氣泡文字、藝術字體等複雜排版
端到端識別
直接從圖像生成文本,無需傳統OCR的分步處理流程
Hoogberta架構
基於改進的Transformer架構,在日文文本識別上表現優異

模型能力

漫畫文本識別
日文OCR
圖像轉文本
氣泡文字提取

使用案例

漫畫翻譯
自動提取對話文本
從掃描的漫畫頁面中自動識別對話內容
可顯著減少人工輸入工作量
內容分析
漫畫內容索引
為漫畫內容建立可搜索的文本數據庫
實現基於文本的漫畫內容檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase