Z

Zonos V0.1 Transformer

Developed by Isi99999
Zonos-v0.1 は、20万時間以上の多言語音声データでトレーニングされた最先端のオープンソース重み付けテキスト音声合成モデルで、表現力と品質においてトップクラスのTTSサービスプロバイダーに匹敵、あるいは凌駕する性能を発揮します。
Downloads 30
Release Time : 2/23/2025

Model Overview

Zonos-v0.1 は、テキストプロンプトから非常に自然な音声を生成できるテキスト音声合成モデルで、音声クローニングと感情制御をサポートしています。

Model Features

ゼロショット音声クローニング
わずか数秒の参照音声クリップで正確な音声クローニングを実現します。
多言語サポート
英語、日本語、中国語、フランス語、ドイツ語など複数の言語をサポートしています。
感情制御
話速、ピッチ変化、音質、および喜び、恐怖、悲しみ、怒りなどの感情を細かく制御できます。
効率的な推論
RTX 4090グラフィックカードで2倍速のリアルタイムファクターを達成します。

Model Capabilities

テキスト音声合成
音声クローニング
感情制御
多言語サポート

Use Cases

音声合成
音声アシスタント
音声アシスタントのための自然な音声を生成します。
非常に自然な音声出力。
オーディオブック
テキストをオーディオブックに変換します。
高品質で表現力豊かな音声。
音声クローニング
パーソナライズド音声
特定の人物の音声をクローンします。
ターゲットの音色を正確に再現。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase