P

Parler Tts Mini V1

由parler-tts開發
輕量級文本轉語音模型,基於4.5萬小時音頻訓練,支持通過文本提示控制語音特徵
下載量 14.16k
發布時間 : 6/26/2024

模型概述

Parler-TTS Mini v1是一款高質量的文本轉語音模型,能夠生成自然流暢的語音,並通過簡單文本提示控制性別、背景噪音、語速等特徵。作為Parler-TTS Large v1的輕量版本,專為高效推理設計。

模型特點

語音特徵控制
通過自然語言描述控制性別、背景噪音、語速、音高和混響等語音特徵
預定義說話人
支持34個預定義說話人音色(如Jon、Lea等),可通過描述文本直接調用
輕量高效
作為Mini版本,相比Large版本具有更快的推理速度和更小的資源佔用
高質量音頻
基於4.5萬小時高質量音頻數據訓練,生成語音自然流暢

模型能力

文本轉語音合成
語音特徵控制
多說話人支持

使用案例

語音合成應用
有聲內容創作
為播客、有聲書等內容生成不同風格的語音
可生成帶有特定情感和風格的語音
輔助技術
為視障人士或閱讀障礙者提供語音輸出
可調節語速和音高以適應不同需求
交互式應用
虛擬助手
為聊天機器人或虛擬助手提供自然語音輸出
可通過提示詞定製助手聲音特性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase