J

Jets

由imdanboy開發
基於ESPnet框架訓練的JETS文本轉語音模型,使用LJSpeech數據集訓練,支持英文語音合成。
下載量 15
發布時間 : 5/28/2022

模型概述

這是一個基於JETS架構的文本轉語音模型,能夠將英文文本轉換為自然語音。模型採用對抗訓練策略,結合了Transformer編碼器和HiFiGAN判別器,生成高質量的語音輸出。

模型特點

高質量語音合成
採用JETS架構結合HiFiGAN判別器,生成自然流暢的語音
對抗訓練策略
使用生成對抗網絡(GAN)訓練方法,提高語音質量
端到端訓練
從文本直接到語音波形的端到端訓練流程
多尺度判別器
使用多尺度多週期判別器(Multi-Scale Multi-Period Discriminator)提升生成質量

模型能力

英文文本轉語音
高質量語音合成
語音特徵控制(音高、能量)

使用案例

語音合成應用
有聲讀物生成
將電子書文本轉換為自然語音
生成接近人類朗讀的語音
語音助手
為虛擬助手提供語音輸出能力
自然流暢的對話語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase