J

Japanese Speecht5 Tts

Developed by esnya
JVS日本語音声コーパスでファインチューニングされたSpeechT5モデル、日本語テキスト音声変換(TTS)タスクに特化
Downloads 296
Release Time : 8/8/2023

Model Overview

このモデルはJVSデータセットでファインチューニングされ、日本語テキストから音声への変換をサポートし、16次元のスピーカー埋め込みベクトルを使用して特定の話者に依存しない汎用的な音質を実現します。

Model Features

日本語専用音声合成
日本語に最適化された音声合成モデルで、JVS日本語音声コーパスで訓練されています
話者非依存設計
16次元のスピーカー埋め込みベクトルを採用し、特定の話者に依存しない汎用的な音質を実現
改良型分かち書き
Open Jtalk技術を改良した分かち書きツールを使用し、日本語テキストをより正確に処理できます

Model Capabilities

日本語テキスト音声変換
音声合成
複数の話者音色をサポート

Use Cases

音声合成アプリケーション
オーディオブック生成
日本語テキストを自然な音声に変換し、オーディオブック制作に利用
人間の音声に近い音声出力を生成
音声アシスタント
日本語音声アシスタントに音声合成機能を提供
異なる音色の音声応答を生成可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase