T

Text To Speech

Nithuによって開発
Fairseq S²ベースのFastSpeech 2テキスト音声合成モデルで、英語単一話者女性音声の合成をサポートします。
ダウンロード数 40
リリース時間 : 10/20/2023

モデル概要

このモデルはFastSpeech 2アーキテクチャに基づくテキスト音声合成(TTS)モデルで、英語単一話者女性音声の合成に特化しており、LJSpeechデータセットからトレーニングされました。

モデル特徴

高品質音声合成
FastSpeech 2アーキテクチャに基づき、自然で流暢な英語女性音声を生成できます。
単一話者モデル
単一話者(女性音声)の音声合成に特化し、一貫した音色と品質を保証します。
HiFi-GANボコーダ統合
HiFi-GANをボコーダとして使用し、高品質な音声波形生成を提供します。

モデル能力

英語テキスト音声合成
単一話者音声合成
高品質音声生成

使用事例

音声合成アプリケーション
音声アシスタント
仮想アシスタントに自然な音声出力を提供
自然で流暢な英語女性音声を生成
オーディオブック
テキストコンテンツを音声に変換
長時間聴取に適した快適な音声を生成
教育アプリケーション
学習アプリに音声出力を提供
明確な英語発音が言語学習に役立つ
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase