X

XTTS V1

由coqui開發
ⓍTTS 是一款語音生成模型,僅需6秒的音頻片段即可克隆聲音並應用於不同語言。
下載量 5,449
發布時間 : 9/13/2023

模型概述

基於Tortoise架構的跨語言語音克隆與生成模型,支持14種語言,可實現情感與風格遷移。

模型特點

快速聲音克隆
僅需6秒音頻即可克隆目標聲音特徵
跨語言支持
支持14種語言的語音生成與跨語言克隆
情感遷移
可保留原始音頻的情感與風格特徵
高質量輸出
24kHz採樣率生成自然語音

模型能力

文本轉語音
語音克隆
跨語言語音生成
情感風格遷移

使用案例

內容創作
多語言有聲內容生成
為視頻、播客等內容快速生成多語言配音
保持統一聲音特徵的同時支持多種語言輸出
輔助技術
語音輔助工具
為語言障礙者創建個性化語音輸出
使用少量樣本即可還原用戶原有聲音特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase