S

Speecht5 Tts

由microsoft開發
基於LibriTTS數據集微調的SpeechT5語音合成(文本轉語音)模型,支持高質量的文本轉語音轉換。
下載量 113.83k
發布時間 : 2/2/2023

模型概述

SpeechT5是一個統一的模態編碼器-解碼器預訓練框架,適用於多種語音語言處理任務。本模型專門針對文本轉語音任務進行了微調。

模型特點

統一模態架構
採用統一的編碼器-解碼器框架處理多種語音語言任務
高質量語音合成
基於LibriTTS數據集微調,生成自然流暢的語音
預訓練框架
支持從預訓練模型進行遷移學習,適應不同語音任務

模型能力

文本轉語音
語音合成
英語語音生成

使用案例

輔助技術
屏幕閱讀器
為視障用戶提供文本內容的語音輸出
生成自然流暢的語音
內容創作
有聲讀物生成
將電子書文本自動轉換為語音
高效生成高質量語音內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase