# ゼロショット音声クローニング

MOSS TTSD V0.5
Apache-2.0
MOSS-TTSDはオープンソースのバイリンガル口語対話合成モデルで、中国語と英語をサポートし、対話脚本を自然で表现力豊かな対話音声に変換することができます。
音声合成 Safetensors 複数言語対応
M
fnlp
182
3
Spark TTS 0.5B
Spark-TTSは、大規模言語モデル(LLM)に基づく高効率のテキスト音声変換システムで、英語と中国語のバイリンガル合成とゼロショット音声クローニングをサポートしています。
音声合成 複数言語対応
S
unsloth
116
3
Spark TTS 0.5B
Spark-TTSは大規模言語モデルを基盤とした先進的なテキスト音声変換システムで、高精度で自然な音声合成を実現します。
音声合成 複数言語対応
S
prince-canuma
20
1
Orpheus
Apache-2.0
Llamaアーキテクチャに基づく最先端の音声大規模モデルで、高品質で共感性のあるテキストから音声への生成に特化
音声合成 Transformers 英語
O
atharva27
20
0
Orpheus 3b 0.1 GGUF
Apache-2.0
Llamaアーキテクチャに基づく音声大規模モデルで、高品質なテキスト読み上げを設計し、感情制御とリアルタイムストリーミングをサポート
音声合成 複数言語対応
O
Prince-1
423
0
Orpheus Exl2 4bit
Apache-2.0
Llamaアーキテクチャに基づく高品質なテキスト読み上げモデル、感情制御と音声クローニングをサポート
音声合成 Transformers 英語
O
YaTharThShaRma999
21
3
Orpheus 3b 0.1 Ft
Apache-2.0
Llamaアーキテクチャに基づく最先端の音声大規模モデルで、高品質で共感力のあるテキスト読み上げ生成のために設計されています
音声合成 Transformers 英語
O
audo
240
1
Zonos V0.1 Transformer
Apache-2.0
Zonos-v0.1 は、20万時間以上の多言語音声データでトレーニングされた最先端のオープンソース重み付けテキスト音声合成モデルで、表現力と品質においてトップクラスのTTSサービスプロバイダーに匹敵、あるいは凌駕する性能を発揮します。
音声合成
Z
Isi99999
30
0
Metavoice 1B V0.1
Apache-2.0
MetaVoice-1Bは12億パラメータのテキスト音声合成(TTS)ベースモデルで、10万時間の音声データでトレーニングされ、感情的な英語音声の生成に特化し、音声クローニングと長文合成をサポートします。
音声合成 英語
M
metavoiceio
571
785
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase