kan-bayashi_jvs_tts_finetune開源日語文本轉語音模型

首頁

Kan Bayashi Jvs Tts Finetune Jvs001 Jsut Vits Raw Phn Jaconv Pyopenjta Truncated 178804

由espnet開發

這是一個基於ESPnet框架訓練的日語文本轉語音(TTS)模型，使用jvs數據集進行微調，支持高質量的日語語音合成。

語音合成日語#日語TTS #高保真語音合成 #VITS架構

下載量 19

發布時間 : 3/2/2022

模型概述

該模型是一個日語文本轉語音系統，能夠將輸入的日語文本轉換為自然流暢的語音輸出。它基於VITS架構，並使用了jaconv和pyopenjtalk等工具進行文本處理。

模型特點

高質量語音合成

能夠生成自然流暢的日語語音輸出

基於VITS架構

使用變分推理與對抗訓練的端到端TTS系統

支持停頓處理

模型能夠處理語音中的自然停頓

音調控制

支持日語中的音調變化處理

模型能力

日語文本轉語音

語音合成

音調控制

使用案例

語音助手

智能客服語音

為日語客服系統提供自然語音輸出

提升用戶體驗和交互自然度

有聲內容創作

電子書朗讀

將日語文本內容轉換為語音

方便視障用戶或提供多模式內容

🚀 ESPnet2 TTS預訓練模型

本模型是一個基於ESPnet的文本轉語音（TTS）預訓練模型，可用於音頻合成相關任務，為語音合成領域提供了強大的支持。

🚀 快速開始

本模型由 kan-bayashi 使用 espnet 中的 jvs/tts1 配方進行訓練。 ♻️ 從 https://zenodo.org/record/5432540/ 導入。

💻 使用示例

基礎用法

# coming soon

📄 許可證

本模型使用的許可證為 CC BY 4.0。

📚 詳細文檔

引用ESPnet

如果你使用了該模型，可以按照以下格式進行引用：

@inproceedings{watanabe2018espnet,
  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson {Enrique Yalta Soplin} and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
  title={{ESPnet}: End-to-End Speech Processing Toolkit},
  year={2018},
  booktitle={Proceedings of Interspeech},
  pages={2207--2211},
  doi={10.21437/Interspeech.2018-1456},
  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
}
@inproceedings{hayashi2020espnet,
  title={{Espnet-TTS}: Unified, reproducible, and integratable open source end-to-end text-to-speech toolkit},
  author={Hayashi, Tomoki and Yamamoto, Ryuichi and Inoue, Katsuki and Yoshimura, Takenori and Watanabe, Shinji and Toda, Tomoki and Takeda, Kazuya and Zhang, Yu and Tan, Xu},
  booktitle={Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={7654--7658},
  year={2020},
  organization={IEEE}
}

或者引用arXiv版本：

@misc{watanabe2018espnet,
      title={ESPnet: End-to-End Speech Processing Toolkit}, 
      author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Enrique Yalta Soplin and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
      year={2018},
      eprint={1804.00015},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}