X

XTTS V1

coquiによって開発
ⓍTTSは音声生成モデルで、わずか6秒の音声サンプルで声をクローンし、異なる言語に適用できます。
ダウンロード数 5,449
リリース時間 : 9/13/2023

モデル概要

Tortoiseアーキテクチャを基にしたクロスランゲージ音声クローンと生成モデルで、14言語をサポートし、感情とスタイルの転送が可能です。

モデル特徴

高速音声クローン
わずか6秒の音声でターゲットの声の特徴をクローン可能
クロスランゲージサポート
14言語の音声生成とクロスランゲージクローンをサポート
感情転送
元の音声の感情とスタイル特徴を保持可能
高品質出力
24kHzサンプリングレートで自然な音声を生成

モデル能力

テキスト読み上げ
音声クローン
クロスランゲージ音声生成
感情スタイル転送

使用事例

コンテンツ制作
マルチランゲージ音声コンテンツ生成
動画、ポッドキャストなどのコンテンツ向けに迅速に多言語音声を生成
統一された声の特徴を維持しながら複数言語出力をサポート
支援技術
音声支援ツール
言語障害者向けに個別化された音声出力を作成
少量のサンプルでユーザーの元の声の特徴を再現可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase