# 零樣本語音克隆

MOSS TTSD V0.5
Apache-2.0
MOSS-TTSD 是一個開源的雙語口語對話合成模型,支持中文和英文,能夠將對話腳本轉化為自然、富有表現力的對話語音。
語音合成 Safetensors 支持多種語言
M
fnlp
182
3
Spark TTS 0.5B
Spark-TTS是一款基於大型語言模型(LLM)的高效文本轉語音系統,支持中英文雙語合成和零樣本語音克隆。
語音合成 支持多種語言
S
unsloth
116
3
Openf5 TTS Base
Apache-2.0
OpenF5 TTS 是一款基於F5-TTS框架訓練的開源文本轉語音模型,支持零樣本語音克隆功能,採用Apache 2.0許可協議,可商業使用。
語音合成 英語
O
mrfakename
391
43
Zonos V0.1 Transformer
Apache-2.0
Zonos-v0.1 是一款領先的開源權重文本轉語音模型,基於超過20萬小時的多語言語音數據訓練而成,其表現力和質量可與頂級TTS服務商媲美,甚至更勝一籌。
語音合成
Z
Isi99999
30
0
Cosyvoice2 0.5B
CosyVoice是一個文本轉語音(TTS)模型,支持多語言和語音轉換功能,提供高質量的語音合成能力。
語音合成
C
FunAudioLLM
4,573
114
F5 TTS Italian
基於F5-TTS架構的意大利語專用文本轉語音模型,使用73+小時意大利語數據微調
語音合成 其他
F
alien79
775
6
GPT SoVITS V1 Base
MIT
GPT-SoVITS (V1) 是一個多語言文本轉語音基礎模型,支持中文、英文和日文。
語音合成 支持多種語言
G
None1145
20
1
Cosyvoice 300M SFT
CosyVoice是一個文本轉語音(TTS)模型,支持多種語言和風格的聲音合成。
語音合成
C
FunAudioLLM
1,768
13
Voicecraft 330M TTSEnhanced
VoiceCraft 是一個基於 PyTorch 的文本轉語音模型,支持高質量的語音合成。
語音合成
V
pyp1
105
1
Voicecraft 830M TTSEnhanced
VoiceCraft 是一個基於 PyTorch 的文本轉語音模型,支持高質量的語音合成。
語音合成 Safetensors
V
pyp1
148
8
Voicecraft Giga330m
VoiceCraft 是一個基於 PyTorch 的文本轉語音模型,支持高質量的語音合成。
語音合成
V
pyp1
1,188
0
Metavoice 1B V0.1
Apache-2.0
MetaVoice-1B是一個12億參數的文本轉語音(TTS)基座模型,經過10萬小時語音數據訓練,專注於生成情感化的英語語音,並支持聲音克隆和長文本合成。
語音合成 英語
M
metavoiceio
571
785
Kinyarwanda YourTTS
基於端到端深度學習的盧旺達語TTS系統,支持零樣本學習,僅需1分鐘語音即可引入新聲音。
語音合成 Transformers 其他
K
DigitalUmuganda
23
2
Kinyarwanda YourTTS V1
CC
這是一個基於深度學習的端到端盧旺達語文本轉語音(TTS)系統,具有零樣本學習能力,僅需1分鐘語音即可引入新聲音。
語音合成 Transformers 其他
K
DigitalUmuganda
15
3
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase