XTTS V2
ⓍTTSは革新的な音声生成モデルで、わずか6秒の音声サンプルでクロスランゲージ音声クローンを実現し、17言語をサポートします。
ダウンロード数 1.7M
リリース時間 : 10/31/2023
モデル概要
ⓍTTSは先進的な音声合成モデルで、極めて短い音声サンプルから音声特徴をクローンし、多言語音声合成と感情スタイル転移をサポートします。
モデル特徴
高速音声クローン
わずか6秒の音声でターゲット音声をクローン可能
多言語サポート
17言語の音声合成をサポート
感情スタイル転移
クローン技術で感情とスタイルの変換を実現
高品質出力
24kHzサンプリングレートで高忠実度音質を提供
複数音声特徴融合
複数の参照音声特徴を融合可能
モデル能力
テキスト読み上げ
音声クローン
クロスランゲージ音声合成
感情スタイル転移
多言語サポート
使用事例
音声合成
パーソナライズ音声アシスタント
音声アシスタント向けに個性的な音声を作成
自然で個性的な音声インタラクション体験を実現
多言語音声コンテンツ制作
同一音声で異なる言語の音声コンテンツを生成
多言語コンテンツ制作プロセスを簡素化
エンターテインメント
ゲームキャラクターボイス
ゲームキャラクター向けに迅速に個性的な音声を生成
ゲーム音声制作コストを削減
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98