T

Tts En Fastpitch

nvidiaによって開発
FastPitchは完全並列のTransformerアーキテクチャを採用したテキスト音声変換モデルで、ピッチや音素の持続時間を制御し、高品質なアメリカ英語音声を生成できます。
ダウンロード数 4,701
リリース時間 : 6/28/2022

モデル概要

Transformerベースの並列TTSモデルで、ピッチ輪郭を予測することで表現力豊かな音声を生成し、リアルタイム音声合成をサポートします。

モデル特徴

完全並列アーキテクチャ
Transformerベースの完全並列設計により、効率的な音声合成を実現
ピッチ制御
ピッチ輪郭を予測・調整可能で、表現力豊かな音声を生成
リアルタイム合成
従来のTacotron2モデルと比較して高いリアルタイム性を実現
教師なしアライメント
教師なしの音声-テキストアライメントを使用し、合成精度を向上

モデル能力

英語テキスト音声変換
ピッチ制御
リアルタイム音声合成
メルスペクトログラム生成

使用事例

音声合成
音声アシスタント
仮想アシスタント向けに自然で流暢な音声応答を生成
表現力豊かなアメリカ英語音声を生成
オーディオブック
テキストコンテンツを音声に変換し、オーディオブック制作に利用
ピッチや話速を調整可能で、リスニング体験を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase