X

XTTS V2

coquiによって開発
ⓍTTSは革新的な音声生成モデルで、わずか6秒の音声サンプルでクロスランゲージ音声クローンを実現し、17言語をサポートします。
ダウンロード数 1.7M
リリース時間 : 10/31/2023

モデル概要

ⓍTTSは先進的な音声合成モデルで、極めて短い音声サンプルから音声特徴をクローンし、多言語音声合成と感情スタイル転移をサポートします。

モデル特徴

高速音声クローン
わずか6秒の音声でターゲット音声をクローン可能
多言語サポート
17言語の音声合成をサポート
感情スタイル転移
クローン技術で感情とスタイルの変換を実現
高品質出力
24kHzサンプリングレートで高忠実度音質を提供
複数音声特徴融合
複数の参照音声特徴を融合可能

モデル能力

テキスト読み上げ
音声クローン
クロスランゲージ音声合成
感情スタイル転移
多言語サポート

使用事例

音声合成
パーソナライズ音声アシスタント
音声アシスタント向けに個性的な音声を作成
自然で個性的な音声インタラクション体験を実現
多言語音声コンテンツ制作
同一音声で異なる言語の音声コンテンツを生成
多言語コンテンツ制作プロセスを簡素化
エンターテインメント
ゲームキャラクターボイス
ゲームキャラクター向けに迅速に個性的な音声を生成
ゲーム音声制作コストを削減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase