P

Parler Tts Large V1

parler-ttsによって開発
22億パラメータを持つテキスト音声変換モデル、4.5万時間の音声データで訓練され、テキストプロンプトによる音声特徴の制御をサポート
ダウンロード数 28.69k
リリース時間 : 8/8/2024

モデル概要

高品質なテキスト音声変換モデル、自然言語記述で性別、背景ノイズ、話速などの特徴を制御可能、34種類のプリセット話者音声をサポート

モデル特徴

自然言語制御
テキスト記述だけで音声の性別、背景ノイズ、話速、ピッチなどの特徴を制御可能
プリセット話者
34種類の特徴的な話者音声(Jon、Leaなど)を内蔵、音声の一貫性を確保
高品質出力
4.5万時間の専門音声データで訓練、自然で滑らかな音声を生成
完全オープンソース
訓練コード、データセット、モデル重みを全て公開

モデル能力

テキスト音声合成
音声特徴制御
多音色生成
韻律制御

使用事例

コンテンツ制作
音声コンテンツ制作
ポッドキャスト、動画ナレーション用に自然な音声を生成
高品質で特徴制御可能な音声出力
支援技術
アクセシビリティリーディング
テキスト内容を音声出力に変換
個性化された音声特徴設定をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase