M

Mms Tts Bgr

由facebook開發
Meta公司開發的欽語、巴姆語文本轉語音模型,屬於大規模多語言語音(MMS)項目的一部分。
下載量 14
發布時間 : 9/1/2023

模型概述

該模型是基於VITS架構的端到端語音合成模型,專門針對欽語和巴姆語(bgr)進行訓練,能夠將文本轉換為自然語音。

模型特點

多語言支持
作為MMS項目的一部分,支持欽語和巴姆語等多樣化的語言
端到端語音合成
基於VITS架構,直接從文本生成語音波形,無需中間特徵提取
表達多樣性
通過隨機時長預測器實現同一文本的不同節奏發音
高質量語音
結合變分下界損失和對抗訓練,生成自然流暢的語音

模型能力

文本轉語音
多語言語音合成
語音波形生成

使用案例

語言保護
少數民族語言語音合成
為欽語和巴姆語等少數民族語言提供語音技術支持
幫助保護和傳播瀕危語言
輔助技術
語音輔助系統
為欽語和巴姆語使用者開發語音輔助應用
提高技術可及性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase