P

Parler Tts Large V1

由parler-tts開發
擁有22億參數的文本轉語音模型,基於4.5萬小時音頻數據訓練,支持通過文本提示控制語音特徵
下載量 28.69k
發布時間 : 8/8/2024

模型概述

高質量文本轉語音模型,可通過自然語言描述控制性別、背景噪音、語速等特徵,支持34個預設說話人音色

模型特點

自然語言控制
通過文本描述即可控制語音的性別、背景噪音、語速、音高等特徵
預設說話人
內置34個特徵鮮明的說話人音色(如Jon、Lea等),確保語音一致性
高質量輸出
基於4.5萬小時專業音頻數據訓練,生成語音自然流暢
完全開源
包含訓練代碼、數據集和模型權重全部開放

模型能力

文本轉語音合成
語音特徵控制
多音色生成
韻律控制

使用案例

內容創作
有聲內容製作
為播客、視頻配音生成自然語音
高質量、可控制特徵的語音輸出
輔助技術
無障礙閱讀
將文本內容轉換為語音輸出
支持個性化語音特徵設置
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase