S

Speecht5 Finetuned Voxpopuli Pl

由weiren119開發
基於microsoft/speecht5_tts在voxpopuli數據集上微調的文本轉語音模型
下載量 38
發布時間 : 7/29/2023

模型概述

該模型是SpeechT5架構的文本轉語音(TTS)實現,專門針對voxpopuli數據集進行了微調,能夠將文本轉換為自然語音。

模型特點

高質量語音合成
基於SpeechT5架構,能夠生成自然流暢的語音輸出
特定領域微調
在voxpopuli數據集上進行了專門微調,可能更適合該數據集特徵的語音生成
高效訓練
採用相對較小的批大小(32)和適中的訓練步數(2000)完成訓練

模型能力

文本轉語音
語音合成

使用案例

語音應用
語音助手
為虛擬助手提供自然語音輸出
有聲讀物生成
將文本內容轉換為語音格式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase