P

Parler Tts Mini V1 Paraspeechcaps Only Base

ajd12342によって開発
テキストスタイルプロンプトで豊かな音声スタイルを制御できるテキスト読み上げモデル
ダウンロード数 17
リリース時間 : 2/28/2025

モデル概要

このモデルはParaSpeechCaps-Baseデータセットでファインチューニングされたテキスト読み上げモデルで、スタイルプロンプトを通じて音声のピッチ、リズム、明瞭度、感情などの特徴を制御できます。

モデル特徴

豊富なスタイル制御
テキストプロンプトで音声のピッチ、リズム、明瞭度、感情などの特徴を精密に制御可能
高品質音声生成
人手によるアノテーションデータセットでファインチューニングされており、生成音声の品質が高い
多様なスタイルラベル
59のスタイルラベルをサポートし、話者の内在的スタイルと文脈的スタイルをカバー

モデル能力

テキスト読み上げ
音声スタイル制御
感情音声合成

使用事例

音声合成アプリケーション
オーディオブック生成
テキスト内容と感情プロンプトに基づいて表現力豊かなオーディオブックを生成
音声アシスタント
音声アシスタントにより自然で感情豊かな音声出力を提供
支援技術
視覚障害者支援
視覚障害ユーザーにより自然で理解しやすい音声出力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase