T

Tts En Fastpitch

由nvidia開發
FastPitch是一種完全並行的Transformer架構文本轉語音模型,能夠控制音高和音素持續時間,生成高質量的英語美式語音。
下載量 4,701
發布時間 : 6/28/2022

模型概述

基於Transformer的並行TTS模型,通過預測音高輪廓生成富有表現力的語音,支持即時語音合成。

模型特點

全並行架構
基於Transformer的完全並行設計,實現高效的語音合成
音高控制
可預測和調節音高輪廓,生成更具表現力的語音
即時合成
相比傳統Tacotron2模型具有更高的即時因子
無監督對齊
採用無監督的語音-文本對齊器,提高合成準確性

模型能力

英語文本轉語音
音高控制
即時語音合成
梅爾頻譜圖生成

使用案例

語音合成
語音助手
為虛擬助手生成自然流暢的語音響應
生成富有表現力的美式英語語音
有聲讀物
將文本內容轉換為語音,用於有聲讀物製作
可調節音高和語速,增強聽感體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase