kan-bayashi_ljspeech_vits開源文本轉語音模型

首頁

Kan Bayashi Ljspeech Vits

由espnet開發

基於ESPnet框架訓練的VITS文本轉語音模型，使用LJSpeech數據集訓練，支持英語語音合成。

語音合成英語#高質量語音合成 #端到端TTS #VITS架構

下載量 2,780

發布時間 : 3/2/2022

模型概述

該模型是一個端到端的文本轉語音(TTS)模型，採用VITS架構，能夠將英文文本轉換為自然語音。

模型特點

端到端語音合成

採用VITS架構實現端到端的文本到語音轉換，無需複雜的特徵工程

高質量語音輸出

基於LJSpeech數據集訓練，可生成自然流暢的英語語音

ESPnet集成

完全兼容ESPnet生態系統，便於部署和集成

模型能力

英語文本轉語音

高質量語音合成

使用案例

語音合成應用

有聲讀物生成

將電子書文本自動轉換為語音

生成自然流暢的有聲讀物

語音助手

為智能助手提供語音輸出能力

提升用戶體驗的自然語音交互

🚀 ESPnet2 TTS預訓練模型

這是一個基於ESPnet的文本轉語音（TTS）預訓練模型，可用於音頻處理相關任務，能有效實現文本到語音的轉換。

🚀 快速開始

模型信息

模型名稱：kan-bayashi/ljspeech_vits
導入來源：♻️ 從 https://zenodo.org/record/5443814/ 導入
訓練者：kan-bayashi
訓練使用的數據集：ljspeech
訓練使用的配方：ljspeech/tts1 配方，來自 espnet

許可證

本模型使用的許可證為 CC BY 4.0。

演示：在ESPnet2中的使用方法

# coming soon

引用ESPnet

如果你在研究中使用了ESPnet，可以按照以下格式進行引用：

Interspeech會議論文引用

@inproceedings{watanabe2018espnet,
  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson {Enrique Yalta Soplin} and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
  title={{ESPnet}: End-to-End Speech Processing Toolkit},
  year={2018},
  booktitle={Proceedings of Interspeech},
  pages={2207--2211},
  doi={10.21437/Interspeech.2018-1456},
  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
}
@inproceedings{hayashi2020espnet,
  title={{Espnet-TTS}: Unified, reproducible, and integratable open source end-to-end text-to-speech toolkit},
  author={Hayashi, Tomoki and Yamamoto, Ryuichi and Inoue, Katsuki and Yoshimura, Takenori and Watanabe, Shinji and Toda, Tomoki and Takeda, Kazuya and Zhang, Yu and Tan, Xu},
  booktitle={Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={7654--7658},
  year={2020},
  organization={IEEE}
}

arXiv預印本引用

@misc{watanabe2018espnet,
      title={ESPnet: End-to-End Speech Processing Toolkit}, 
      author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Enrique Yalta Soplin and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
      year={2018},
      eprint={1804.00015},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}