J

Japanese Speecht5 Tts

esnyaによって開発
JVS日本語音声コーパスでファインチューニングされたSpeechT5モデル、日本語テキスト音声変換(TTS)タスクに特化
ダウンロード数 296
リリース時間 : 8/8/2023

モデル概要

このモデルはJVSデータセットでファインチューニングされ、日本語テキストから音声への変換をサポートし、16次元のスピーカー埋め込みベクトルを使用して特定の話者に依存しない汎用的な音質を実現します。

モデル特徴

日本語専用音声合成
日本語に最適化された音声合成モデルで、JVS日本語音声コーパスで訓練されています
話者非依存設計
16次元のスピーカー埋め込みベクトルを採用し、特定の話者に依存しない汎用的な音質を実現
改良型分かち書き
Open Jtalk技術を改良した分かち書きツールを使用し、日本語テキストをより正確に処理できます

モデル能力

日本語テキスト音声変換
音声合成
複数の話者音色をサポート

使用事例

音声合成アプリケーション
オーディオブック生成
日本語テキストを自然な音声に変換し、オーディオブック制作に利用
人間の音声に近い音声出力を生成
音声アシスタント
日本語音声アシスタントに音声合成機能を提供
異なる音色の音声応答を生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase