# 隨機時長預測

Swaram
Swaram 是一個先進的馬拉雅拉姆語語音合成模型,能夠根據輸入文本生成高質量的語音波形。
語音合成 其他
S
aoxo
735
1
Mms Tts Bmq
Meta公司開發的博穆語文本轉語音模型,支持高質量語音合成
語音合成 Transformers
M
facebook
7
0
Mms Tts Smo
Meta公司開發的薩摩亞語文本轉語音模型,基於VITS架構,支持高質量語音合成
語音合成 Transformers
M
facebook
21
0
Mms Tts Shi
Meta公司開發的塔奇希特語文本轉語音模型,屬於大規模多語言語音研究計劃的一部分
語音合成 Transformers
M
facebook
32
1
Mms Tts Tpi
Meta公司開發的托克皮辛語文本轉語音模型,基於VITS架構,支持高質量語音合成
語音合成 Transformers
M
facebook
1,223
0
Mms Tts Kaz
Meta公司開發的哈薩克語文本轉語音模型,基於VITS架構,支持高質量的語音合成
語音合成 Transformers
M
facebook
1,757
2
Mms Tts Tgk
Meta公司開發的塔吉克語文本轉語音模型,基於VITS架構,支持高質量語音合成
語音合成 Transformers
M
facebook
895
1
Mms Tts Ewe
Meta公司開發的埃維語文本轉語音模型,屬於MMS項目的一部分,支持高質量語音合成
語音合成 Transformers
M
facebook
496
1
Mms Tts Hat
Meta公司開發的海地克里奧爾語文本轉語音模型,屬於大規模多語言語音(MMS)項目的一部分
語音合成 Transformers
M
facebook
223
1
Mms Tts Sqi
Meta公司開發的阿爾巴尼亞語文本轉語音模型,基於VITS架構,支持高質量語音合成
語音合成 Transformers
M
facebook
339
2
Vits Vctk
MIT
VITS是一種端到端語音合成模型,能夠根據輸入的文本序列預測對應的語音波形。該模型採用條件變分自編碼器(VAE)架構,包含後驗編碼器、解碼器和條件先驗模塊。
語音合成 Transformers
V
kakao-enterprise
3,601
13
Vits Ljs
MIT
VITS是一種端到端語音合成模型,能夠根據輸入文本序列預測對應的語音波形。
語音合成 Transformers
V
kakao-enterprise
1,127
41
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase