T

Tts Ru Hifigan Ruslan

由bene-ges開發
一個基於RUSLAN語料庫訓練的俄語文本轉語音模型,採用FastPitch和HifiGAN架構,支持22.05kHz採樣率的語音合成。
下載量 38
發布時間 : 4/18/2023

模型概述

該模型是一個俄語文本轉語音(TTS)系統,能夠將俄語文本轉換為自然語音。它使用IPA音標進行文本預處理(G2P),通過FastPitch生成梅爾頻譜圖,最後用HifiGAN聲碼器合成高質量語音。

模型特點

高質量語音合成
使用HifiGAN聲碼器生成22.05kHz採樣率的高質量語音
音標預處理
採用IPA音標進行文本預處理(G2P),提高發音準確性
單說話人模型
基於RUSLAN語料庫訓練,專注於單一男聲的語音合成

模型能力

俄語文本轉語音
22.05kHz高質量語音合成
基於IPA的音標轉換

使用案例

語音合成應用
有聲讀物生成
將俄語文本轉換為自然語音,用於製作有聲讀物
22.05kHz採樣率的高質量語音輸出
語音助手
為俄語語音助手提供語音合成能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase