X

XTTS V2

由coqui開發
ⓍTTS是一款革命性的語音生成模型,僅需6秒音頻片段即可實現跨語言音色克隆,支持17種語言。
下載量 1.7M
發布時間 : 10/31/2023

模型概述

ⓍTTS是一款先進的語音合成模型,能夠通過極短的音頻樣本克隆音色,並支持多語言語音合成與情感風格遷移。

模型特點

快速音色克隆
僅需6秒音頻即可克隆目標音色
跨語言支持
支持17種語言的語音合成
情感風格遷移
可通過克隆實現情感與風格的轉換
高質量輸出
24kHz採樣率提供高保真音質
多參考音色融合
支持融合多個參考音色特徵

模型能力

文本轉語音
音色克隆
跨語言語音合成
情感風格遷移
多語言支持

使用案例

語音合成
個性化語音助手
為語音助手創建個性化音色
實現自然、個性化的語音交互體驗
多語言有聲內容創作
使用同一音色生成不同語言的語音內容
簡化多語言內容製作流程
娛樂應用
遊戲角色配音
快速生成遊戲角色的個性化語音
降低遊戲配音成本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase