P

Parler Tts Mini V1 Paraspeechcaps

由ajd12342開發
基於Parler-TTS Mini v1微調的文本轉語音模型,支持通過風格提示控制語音輸出
下載量 139
發布時間 : 2/27/2025

模型概述

該模型在ParaSpeechCaps數據集上微調,能夠通過文本風格提示(如音高、節奏、清晰度、情感等)生成豐富風格的語音輸出。

模型特點

風格控制
支持通過文本提示精確控制語音輸出的風格特徵(如音高、節奏、情感等)
大規模風格標註
基於ParaSpeechCaps數據集訓練,包含59種風格標籤的豐富標註
多模態訓練
結合文本和語音嵌入器、分類器以及音頻語言模型的新穎訓練流程

模型能力

文本轉語音
語音風格控制
多風格語音生成

使用案例

語音合成
情感化語音生成
根據文本提示生成帶有特定情感的語音
可生成悲傷、快樂等不同情感的語音輸出
風格化語音創作
為影視、遊戲等創作具有特定風格的語音
可控制語速、清晰度等參數生成專業級語音
輔助技術
無障礙語音合成
為視障用戶提供可定製的語音輸出
可根據用戶偏好調整語音特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase