A

Anime Whisper

由litagin開發
專精於日式動畫風格表演臺詞領域的日語語音識別模型
下載量 4,873
發布時間 : 11/10/2024

模型概述

基於kotoba-whisper-v2.0微調,針對動畫風格語音優化的日語ASR模型,特別擅長處理非語言發聲和情感表達

模型特點

減少幻覺現象
相比同類模型顯著減少了錯誤生成內容的情況
非語言發聲識別
精準捕捉言語停頓、笑聲、呼喊、喘息等非語言發聲
情感化標點生成
標點符號隨語音節奏情感自然生成,呈現劇本級文本流暢度
動畫語音優化
對動畫風格表演臺詞識別準確率尤為突出
NSFW內容處理
能專業處理其他模型難以勝任的成人向音頻轉寫

模型能力

日語語音識別
動畫風格語音轉寫
非語言發聲識別
情感化文本生成

使用案例

動漫製作
動畫配音轉寫
將動畫配音轉換為劇本格式文本
準確率比通用模型提高約20%
遊戲開發
視覺小說臺詞轉錄
自動轉錄Galgame遊戲中的對話內容
CER(字符錯誤率)平均13.0%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase