X

XTTS V2

reach-vbによって開発
ⓍTTSは先進的な音声生成モデルで、わずか6秒の音声でクロスランゲージ音声クローンを実現し、16言語をサポートします。
ダウンロード数 125
リリース時間 : 11/14/2023

モデル概要

ⓍTTSは深層学習に基づく音声生成モデルで、極めて短い音声サンプルから音声をクローンし、多言語音声を生成できます。感情とスタイルの転移もサポートしています。

モデル特徴

極短サンプルクローン
わずか6秒の音声で高品質な音声クローンを実現
多言語サポート
16言語の音声生成とクロスランゲージクローンをサポート
感情スタイル転移
クローンを通じて感情とスタイルの変換が可能
音質向上
24kHzサンプリングレートで韻律と音質を全面的に改善

モデル能力

テキスト読み上げ
音声クローン
クロスランゲージ音声生成
感情スタイル転移
複数話者参照
音声補間

使用事例

音声合成
パーソナライズ音声アシスタント
音声アシスタントに個性的な音声を作成
自然で滑らかな個性的な音声出力
多言語コンテンツ制作
動画、ポッドキャストなどのコンテンツに多言語音声を追加
同じ音声特性を維持した多言語音声
アクセシビリティ技術
音声復元
音声能力を失った人の個人音声を復元
個人の音声特性を保持した音声出力
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase