K

Kan Bayashi Libritts Xvector Vits

espnetによって開発
ESPnetフレームワークでトレーニングされたテキスト読み上げモデルで、LibriTTSデータセットを使用して英語音声合成をサポートします。
ダウンロード数 61
リリース時間 : 3/2/2022

モデル概要

このモデルはエンドツーエンドのテキスト読み上げ(TTS)モデルで、入力された英語テキストを自然な音声に変換できます。

モデル特徴

高品質音声合成
自然で流暢な英語音声を生成可能
エンドツーエンドアーキテクチャ
VITSアーキテクチャを採用し、テキストから音声への直接変換を実現
x-vectorサポート
x-vector特徴を統合し、話者特徴制御を可能にする

モデル能力

英語テキスト読み上げ
高品質音声合成

使用事例

音声合成アプリケーション
オーディオブック生成
電子書籍テキストを音声に変換
自然で流暢なオーディオブックを生成
音声アシスタント
スマートデバイスに音声出力機能を提供
より自然な音声インタラクションを実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase