F

F5 TTS Vietnamese 100h

由hynt開發
基於F5-TTS微調的緊湊版本,訓練數據為150小時的越南語語音,僅限研究用途。
下載量 123
發布時間 : 3/23/2025

模型概述

這是一個針對越南語優化的文本轉語音(TTS)模型,基於F5-TTS架構微調,適用於越南語語音合成任務。

模型特點

高質量越南語語音合成
使用150小時精選越南語語音數據訓練,提供高質量的語音合成效果
嚴格的數據處理
使用demucs去除背景音樂,過濾短於1秒或長於30秒的音頻,保證數據質量
學術合作數據集
包含VLSP系列數據集和UEH大學提供的50小時高質量標註數據

模型能力

越南語文本轉語音
語音合成
語音克隆(通過參考音頻)

使用案例

學術研究
越南語語音合成研究
用於語音合成技術的研究和實驗
教育應用
越南語學習輔助
為越南語學習者提供發音參考
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase