vits-eng開源英文文本轉語音模型 - 支持高質量語音合成，免費使用

首頁

Vits Eng

由BricksDisplay開發

基於VITS架構的英文文本轉語音模型，由Kakao Enterprise訓練，支持高質量語音合成

語音合成

Transformers

英語開源協議:MIT #英語語音合成 #音素轉換 #高保真音頻

下載量 28

發布時間 : 1/15/2024

模型概述

這是一個基於VITS架構的英文文本轉語音模型，能夠將英文文本轉換為自然語音輸出。模型基於LJ Speech數據集訓練，適合需要英文語音合成的應用場景。

模型特點

高質量語音合成

基於VITS架構，能生成自然流暢的英文語音

端到端模型

直接從文本到語音的端到端合成，無需複雜的中間處理

音素輸入支持

支持音素輸入，可結合phonemize庫進行預處理

模型能力

英文文本轉語音

高質量語音合成

支持16kHz採樣率音頻輸出

使用案例

語音助手

智能語音助手

為智能設備提供自然語音輸出

生成自然流暢的語音響應

有聲讀物

電子書朗讀

將電子書內容轉換為語音

生成清晰可懂的有聲讀物

教育應用

語言學習工具

為語言學習應用提供標準發音

幫助學習者掌握正確發音

屬性	詳情
模型類型	文本轉語音
訓練數據	lj_speech
庫名稱	transformers.js
基礎模型	kakao-enterprise/vits-ljs

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Vits Eng

模型概述

模型特點

模型能力

使用案例

🚀 文本轉語音模型

🚀 快速開始

💻 使用示例

基礎用法

📄 許可證

📦 相關信息