S

SARA TTS

由BHOSAI開發
巴庫高等石油學校人工智能研發中心與PRODATA合作推出的阿塞拜疆語文本轉語音模型,基於VITS架構並參考Meta MMS模型。
下載量 173
發布時間 : 7/30/2024

模型概述

該模型專注於阿塞拜疆語的文本轉語音任務,通過改進輸入標記的穩健性來提升語音自然度和語調穩定性。

模型特點

改進的穩健性
通過優化輸入標記處理,解決了原Meta MMS模型對輸入標記變化敏感的問題,使語調更加穩定。
高質量語音合成
基於VITS架構,能夠生成自然度較高的阿塞拜疆語語音。
數據增強
通過組合2-3個句子生成連貫的輸入語音,提升了模型的上下文處理能力。

模型能力

阿塞拜疆語文本轉語音
自然語音合成

使用案例

語音助手
阿塞拜疆語語音助手
為阿塞拜疆語用戶提供本地化的語音交互體驗。
生成自然流暢的阿塞拜疆語語音響應
教育科技
語言學習工具
幫助學習者練習阿塞拜疆語發音和聽力。
提供準確的阿塞拜疆語發音示範
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase