# リアルタイム音声合成

Spark TTS 0.5B GGUF
Spark-TTS-0.5B は prince-canuma/Spark-TTS-0.5B を基にした量子化バージョンで、英語と中国語のテキスト読み上げタスクをサポートします。
音声合成 複数言語対応
S
mradermacher
318
0
Orpheus
Apache-2.0
Llamaアーキテクチャに基づく最先端の音声大規模モデルで、高品質で共感性のあるテキストから音声への生成に特化
音声合成 Transformers 英語
O
atharva27
20
0
Orpheus 3b 0.1 Ft 16bit
Apache-2.0
アルパカモデルを基盤とした最先端の音声大規模言語モデルで、高品質で共感性のあるテキストから音声への生成に特化
音声合成 Transformers 複数言語対応
O
Prince-1
60
0
Orpheus Awq
Apache-2.0
Orpheus-3b FTの4ビットAWQ量子化バージョンで、テキストから音声への変換タスクに最適化されており、音声クローン機能をサポートしています。
音声合成 英語
O
YaTharThShaRma999
48
3
Llama OuteTTS 1.0 1B Bf16
これはMLX形式のテキスト音声変換モデルで、複数の言語をサポートし、音声合成タスクに適しています。
音声合成 複数言語対応
L
mlx-community
23
0
Llama OuteTTS 1.0 1B 3bit
これはMLX形式の3ビット量子化テキスト読み上げモデルで、複数の言語をサポートしています。
音声合成 複数言語対応
L
mlx-community
16
0
Dia 1.6B 6bit
Apache-2.0
Dia-1.6B-6bit は Dia-1.6B を基にした 6 ビット量子化バージョンで、MLX フレームワーク向けに最適化されたテキスト読み上げモデルです。
音声合成 英語
D
mlx-community
76
4
Kokoro 82M
Apache-2.0
Kokoroは8200万パラメータのオープンソースTTSモデルで、音質はより大規模なモデルに匹敵しつつ、顕著な速度優位性とコスト効率を備えています。
音声合成 英語
K
prince-canuma
376
2
Zonos V0.1 Transformer
Apache-2.0
Zonos-v0.1 は、20万時間以上の多言語音声データでトレーニングされた最先端のオープンソース重み付けテキスト音声合成モデルで、表現力と品質においてトップクラスのTTSサービスプロバイダーに匹敵、あるいは凌駕する性能を発揮します。
音声合成
Z
Isi99999
30
0
XTTS V2 Urdu FT
MIT
ウルドゥー語のテキスト読み上げと音声クローンをサポートするTTSモデル
音声合成
X
suhaibrashid17
70
3
Indri 0.1 124m Tts
IndriはTransformerアーキテクチャに基づく超小型軽量級TTSモデルで、英語とヒンディー語のテキスト読み上げタスクをサポートします。
音声合成 Transformers 複数言語対応
I
11mlabs
182
3
Tts En Fastpitch
FastPitchは完全並列のTransformerアーキテクチャを採用したテキスト音声変換モデルで、ピッチや音素の持続時間を制御し、高品質なアメリカ英語音声を生成できます。
音声合成 英語
T
nvidia
4,701
38
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase