V

Visual Novel Transcriptor

由spow12開發
基於distil-whisper/distil-large-v2微調的日語語音識別模型,專為日語音頻轉寫設計,特別針對視覺小說場景優化
下載量 31
發布時間 : 4/15/2024

模型概述

這是一個自動語音識別(ASR)模型,主要用於將日語語音轉換為文本,特別適合處理視覺小說中的對話內容

模型特點

視覺小說場景優化
專門針對視覺小說中的對話內容進行優化,能夠更好地處理這類音頻
日語識別能力
專注於日語語音識別,在日語環境下表現更佳
輕量級模型
基於distil-whisper的輕量級版本,在保持性能的同時減少計算資源需求

模型能力

日語語音轉文本
英語語音轉文本
視覺小說對話識別

使用案例

動漫相關應用
視覺小說轉錄
將視覺小說中的日語對話轉換為文本
生成可編輯的對話文本
動漫語音識別
識別動漫中的日語對話內容
生成字幕或腳本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase