X

XTTS V1

Developed by coqui
ⓍTTS 是一款语音生成模型,仅需6秒的音频片段即可克隆声音并应用于不同语言。
Downloads 5,449
Release Time : 9/13/2023

Model Overview

基于Tortoise架构的跨语言语音克隆与生成模型,支持14种语言,可实现情感与风格迁移。

Model Features

快速声音克隆
仅需6秒音频即可克隆目标声音特征
跨语言支持
支持14种语言的语音生成与跨语言克隆
情感迁移
可保留原始音频的情感与风格特征
高质量输出
24kHz采样率生成自然语音

Model Capabilities

文本转语音
语音克隆
跨语言语音生成
情感风格迁移

Use Cases

内容创作
多语言有声内容生成
为视频、播客等内容快速生成多语言配音
保持统一声音特征的同时支持多种语言输出
辅助技术
语音辅助工具
为语言障碍者创建个性化语音输出
使用少量样本即可还原用户原有声音特征
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase