S

Speecht5 Tts Hr

由nikolab開發
針對克羅地亞語優化的SpeechT5文本轉語音微調模型,基於微軟SpeechT5架構和VoxPopuli數據集訓練
下載量 124
發布時間 : 9/30/2024

模型概述

基於Transformer架構的語音合成模型,支持克羅地亞語文本到語音轉換,可應用於語音助手、有聲讀物等場景

模型特點

多模態統一架構
單一架構集成文本和語音處理能力,支持跨模態轉換
克羅地亞語優化
使用43小時克羅地亞語VoxPopuli數據集微調,包含83位說話人數據
跨語言擴展性
架構設計支持前南斯拉夫地區語言(黑山語/塞爾維亞語/波斯尼亞語)的擴展
說話人平衡
訓練數據經過說話人統計分析,確保男女說話人比例平衡

模型能力

克羅地亞語文本轉語音
語音合成
跨模態表徵學習

使用案例

語音助手
克羅地亞語語音交互
為智能設備提供自然語音輸出
支持20詞以內的流暢語音生成
無障礙技術
文本轉語音服務
為視障用戶轉換文字內容為語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase