P

Parler Tts

由ipsilondev開發
Parler-TTS Mini v0.1 是一個輕量級的文本轉語音模型,基於10.5K小時的音頻數據訓練而成,能夠生成高質量、自然流暢的語音,並通過簡單的文本提示控制語音特徵。
下載量 18
發布時間 : 4/23/2024

模型概述

這是一個完全開源的文本轉語音模型,能夠通過文本提示控制語音的性別、背景噪音、語速、音調和混響效果等特徵。

模型特點

高質量語音生成
基於10.5K小時的音頻數據訓練,能夠生成高質量、自然流暢的語音
語音特徵控制
通過簡單的文本提示控制語音特徵,如性別、背景噪音、語速、音調和混響效果
完全開源
所有數據集、預處理、訓練代碼和權重均在寬鬆許可下公開
韻律控制
可以使用標點符號控制生成的韻律,例如使用逗號在語音中添加短暫停頓

模型能力

文本轉語音
語音特徵控制
韻律控制

使用案例

語音合成
個性化語音生成
根據用戶需求生成不同性別、語速和音調的語音
生成自然流暢的個性化語音
有聲讀物製作
快速將文本內容轉換為語音,用於有聲讀物製作
高效生成高質量的有聲內容
輔助技術
語音輔助設備
為視障人士或其他需要語音輔助的用戶提供支持
生成清晰可理解的語音輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase