E

English Voice Tts

由Baghdad99開發
Meta公司開發的英語文本轉語音模型,基於VITS架構,支持高質量語音合成
下載量 48
發布時間 : 11/17/2023

模型概述

基於VITS架構的端到端英語文本轉語音模型,能夠根據輸入文本生成自然語音波形,屬於Meta大規模多語言語音(MMS)項目的一部分

模型特點

端到端語音合成
直接從文本生成語音波形,無需中間特徵提取步驟
變分推理與對抗訓練
結合變分下界損失和對抗訓練進行端到端訓練,提高語音質量
隨機時長預測
支持從相同文本生成不同節奏的語音,增強表現力
多語言支持
作為MMS項目的一部分,支持多種語言的獨立模型

模型能力

英語文本轉語音
高質量語音合成
可變節奏語音生成

使用案例

語音輔助技術
語音助手
為智能助手提供自然語音輸出
生成接近人類發音的語音
無障礙技術
文本朗讀
為視障用戶朗讀文本內容
提供清晰自然的語音輸出
內容創作
有聲內容製作
自動生成播客、有聲書等內容的語音
快速生成專業級語音內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase