vits-cmn开源文本转语音模型 - 免费部署实现高质量中文语音合成

Home

Vits Cmn

Developed by BricksDisplay

VITS是一种基于对抗学习的条件变分自编码器端到端文本转语音模型，支持中文语音合成。

语音合成

Transformers

ChineseOpen Source License:Apache-2.0 #中文TTS #多发音人 #端到端语音合成

Downloads 21

Release Time : 1/10/2024

Model Overview

该模型采用条件变分自编码器架构，能够根据输入的文本序列预测对应的语音波形，支持44种发音人。

Model Features

端到端语音合成

直接从文本生成语音波形，无需中间特征提取步骤。

多发音人支持

支持44种不同发音人的语音合成。

对抗学习训练

采用对抗训练策略提高语音质量和自然度。

中文优化

专门针对中文语音特性进行优化，支持拼音输入。

Model Capabilities

中文文本转语音

多发音人语音合成

高质量语音生成

Use Cases

语音交互

智能语音助手

为智能设备提供自然的中文语音输出能力。

生成自然流畅的中文语音

无障碍应用

文本朗读

为视障用户提供文本内容朗读功能。

高质量的中文语音输出

多媒体制作

视频配音

为视频内容自动生成中文配音。

多种发音人选择，自然语音效果

属性	详情
支持语言	中文
训练数据集	THCHS - 30
说话人数量	44
训练时长	48小时

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Vits Cmn

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 VITS：用于端到端文本转语音的对抗学习条件变分自编码器

🚀 快速开始

模型详情

💻 使用示例

基础用法

高级用法

📄 许可证