kan-bayashi_ljspeech_tacotron2开源文本转语音模型 - 依托数据集实现免费语音转换

首页

Kan Bayashi Ljspeech Tacotron2

由 espnet 开发

基于ESPnet框架训练的Tacotron2文本转语音模型，使用LJSpeech数据集

语音合成英语#英文TTS #高保真语音合成 #端到端模型

下载量 40

发布时间 : 3/2/2022

模型简介

这是一个基于Tacotron2架构的文本转语音(TTS)模型，能够将英文文本转换为自然语音。模型使用LJSpeech数据集训练，适用于语音合成应用。

模型特点

高质量语音合成

基于Tacotron2架构，能够生成自然流畅的语音输出

ESPnet框架支持

使用ESPnet工具包训练，具有良好的兼容性和可扩展性

标准数据集训练

使用广泛认可的LJSpeech数据集训练，确保模型质量

模型能力

英文文本转语音

语音合成

使用案例

语音应用

有声读物生成

将电子书文本自动转换为语音

生成自然流畅的有声读物

语音助手

为智能设备提供语音输出能力

实现更自然的语音交互体验

🚀 ESPnet2 TTS示例模型

本模型是一个文本转语音（TTS）模型，基于espnet框架训练，可用于音频合成相关任务。

🚀 快速开始

此模型由 kan-bayashi 使用 espnet 中的 ljspeech/tts1 配方进行训练。它从 https://zenodo.org/record/3989498/ 导入。

💻 使用示例

基础用法

# coming soon

📄 许可证

本项目采用 cc-by-4.0 许可证。

📚 详细文档

引用ESPnet

如果你在研究中使用了ESPnet，可以按照以下方式进行引用：

@inproceedings{watanabe2018espnet,
  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson {Enrique Yalta Soplin} and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
  title={{ESPnet}: End-to-End Speech Processing Toolkit},
  year={2018},
  booktitle={Proceedings of Interspeech},
  pages={2207--2211},
  doi={10.21437/Interspeech.2018-1456},
  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
}
@inproceedings{hayashi2020espnet,
  title={{Espnet-TTS}: Unified, reproducible, and integratable open source end-to-end text-to-speech toolkit},
  author={Hayashi, Tomoki and Yamamoto, Ryuichi and Inoue, Katsuki and Yoshimura, Takenori and Watanabe, Shinji and Toda, Tomoki and Takeda, Kazuya and Zhang, Yu and Tan, Xu},
  booktitle={Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={7654--7658},
  year={2020},
  organization={IEEE}
}

或者引用arXiv版本：

@misc{watanabe2018espnet,
      title={ESPnet: End-to-End Speech Processing Toolkit}, 
      author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Enrique Yalta Soplin and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
      year={2018},
      eprint={1804.00015},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}