P

Parler Tts Mini V1

parler-ttsによって開発
軽量テキスト音声合成モデル、4.5万時間の音声データで訓練、テキストプロンプトによる音声特徴制御をサポート
ダウンロード数 14.16k
リリース時間 : 6/26/2024

モデル概要

Parler-TTS Mini v1は高品質なテキスト音声合成モデルで、自然で流暢な音声を生成し、簡単なテキストプロンプトで性別、背景ノイズ、話速などの特徴を制御できます。Parler-TTS Large v1の軽量版として、効率的な推論のために設計されています。

モデル特徴

音声特徴制御
自然言語記述で性別、背景ノイズ、話速、ピッチ、リバーブなどの音声特徴を制御
事前定義話者
34種類の事前定義話者音声(Jon、Leaなど)をサポート、記述テキストで直接呼び出し可能
軽量効率
Mini版として、Large版に比べて推論速度が速く、リソース使用量が少ない
高品質音声
4.5万時間の高品質音声データで訓練、自然で流暢な音声を生成

モデル能力

テキスト音声合成
音声特徴制御
複数話者対応

使用事例

音声合成アプリケーション
音声コンテンツ制作
ポッドキャスト、オーディオブックなどのコンテンツ向けに異なるスタイルの音声を生成
特定の感情やスタイルを持つ音声を生成可能
支援技術
視覚障害者や読字障害者向けに音声出力を提供
異なるニーズに合わせて話速やピッチを調整可能
インタラクティブアプリケーション
仮想アシスタント
チャットボットや仮想アシスタントに自然な音声出力を提供
プロンプトでアシスタントの音声特性をカスタマイズ可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase