X

Xphonebert Base

由vinai開發
XPhoneBERT是首個面向文本轉語音(TTS)的音素表徵預訓練多語言模型,基於BERT-base架構,使用近100種語言的3.3億條音素級句子訓練。
下載量 7,561
發布時間 : 4/13/2023

模型概述

XPhoneBERT是一個預訓練的多語言音素表徵模型,專為文本轉語音(TTS)任務設計,能夠提升TTS模型在自然度和韻律方面的表現。

模型特點

多語言支持
支持近100種語言和地區的音素表徵學習
音素級預訓練
使用3.3億條音素級句子進行預訓練,優化TTS任務表現
提升TTS質量
作為輸入音素編碼器可顯著提升TTS模型的自然度和韻律表現
低資源適應
在有限訓練數據下仍能生成較高質量的語音

模型能力

音素序列編碼
多語言文本轉音素
提升TTS模型性能

使用案例

語音合成
高質量TTS系統
作為前端音素編碼器集成到TTS系統中
提升合成語音的自然度和韻律表現
低資源語言TTS
在訓練數據有限的語言中構建TTS系統
生成質量相對較高的語音輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase