D

Donut Base Japanese Visual Novel

由oshizo開發
該模型是在視覺小說風格圖像的合成數據集上對naver-clova-ix/donut-base進行訓練的成果,專門用於識別視覺小說中的文本和選項。
下載量 14
發布時間 : 5/3/2023

模型概述

Donut模型經過微調,專門用於識別視覺小說風格的圖像中的文本內容,包括對話、選項和角色名稱。

模型特點

視覺小說專用
專門針對視覺小說風格的圖像進行優化,能準確識別對話、選項和角色名稱。
佈局適應
訓練包含多種常見視覺小說佈局及其變體,能處理不同排版格式。
注音過濾
設計目標是不受注音假名影響,專注於準確讀取正文內容。
UI元素過濾
能儘量避免讀取SAVE、LOAD等UI元素及日期顯示等非對話內容。

模型能力

視覺小說圖像識別
日語文本提取
對話選項解析
角色名稱識別

使用案例

遊戲開發
視覺小說文本提取
自動識別視覺小說遊戲截圖中的對話內容和選項
輸出結構化JSON格式的對話信息
遊戲測試自動化
用於自動化測試視覺小說遊戲中的文本顯示
驗證遊戲文本是否正確顯示
本地化工具
翻譯輔助
提取視覺小說文本用於翻譯工作
提供待翻譯文本的準確提取
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase