Vits Cmn

V

Vits Cmn

由BricksDisplay開發

VITS是一種基於對抗學習的條件變分自編碼器端到端文本轉語音模型，支持中文語音合成。

中文開源協議:Apache-2.0 #中文TTS #多發音人 #端到端語音合成

下載量 21

發布時間 : 1/10/2024

模型概述

該模型採用條件變分自編碼器架構，能夠根據輸入的文本序列預測對應的語音波形，支持44種發音人。

模型特點

端到端語音合成

直接從文本生成語音波形，無需中間特徵提取步驟。

多發音人支持

支持44種不同發音人的語音合成。

對抗學習訓練

採用對抗訓練策略提高語音質量和自然度。

中文優化

專門針對中文語音特性進行優化，支持拼音輸入。

模型能力

中文文本轉語音

多發音人語音合成

高質量語音生成

使用案例

語音交互

智能語音助手

為智能設備提供自然的中文語音輸出能力。

生成自然流暢的中文語音

無障礙應用

文本朗讀

為視障用戶提供文本內容朗讀功能。

高質量的中文語音輸出

多媒體制作

視頻配音

為視頻內容自動生成中文配音。

多種發音人選擇，自然語音效果

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase