P

Parler Tts Mini V1 Paraspeechcaps

ajd12342によって開発
Parler-TTS Mini v1をファインチューニングしたテキスト音声変換モデルで、スタイルプロンプトによる音声出力制御をサポート
ダウンロード数 139
リリース時間 : 2/27/2025

モデル概要

このモデルはParaSpeechCapsデータセットでファインチューニングされており、テキストスタイルプロンプト(ピッチ、リズム、明瞭度、感情など)を通じて豊富なスタイルの音声出力を生成可能

モデル特徴

スタイル制御
テキストプロンプトを通じて音声出力のスタイル特徴(ピッチ、リズム、感情など)を精密に制御可能
大規模スタイルアノテーション
ParaSpeechCapsデータセットで訓練されており、59種類のスタイルラベルの豊富なアノテーションを含む
マルチモーダル訓練
テキストと音声エンベッダー、分類器、音声言語モデルを組み合わせた新しい訓練プロセス

モデル能力

テキスト音声変換
音声スタイル制御
マルチスタイル音声生成

使用事例

音声合成
感情的音声生成
テキストプロンプトに基づき特定の感情を持つ音声を生成
悲しみ、喜びなど異なる感情の音声出力を生成可能
スタイル化音声創作
映画、ゲームなどのために特定のスタイルを持つ音声を創作
話速、明瞭度などのパラメータを制御しプロ級の音声を生成
支援技術
アクセシブル音声合成
視覚障害ユーザー向けにカスタマイズ可能な音声出力を提供
ユーザーの好みに応じて音声特徴を調整可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase