P

Parler Tts

ipsilondevによって開発
Parler-TTS Mini v0.1は軽量のテキスト音声変換モデルで、10.5K時間の音声データを基に訓練され、高品質で自然な流れの良い音声を生成でき、簡単なテキストプロンプトで音声の特徴を制御できます。
ダウンロード数 18
リリース時間 : 4/23/2024

モデル概要

これは完全にオープンソースのテキスト音声変換モデルで、テキストプロンプトを通じて音声の性別、背景ノイズ、話速、音程、リバーブ効果などの特徴を制御できます。

モデル特徴

高品質音声生成
10.5K時間の音声データを基に訓練され、高品質で自然な流れの良い音声を生成できます。
音声特徴制御
簡単なテキストプロンプトで音声の性別、背景ノイズ、話速、音程、リバーブ効果などの特徴を制御できます。
完全オープンソース
すべてのデータセット、前処理、訓練コード、重みは緩やかなライセンスの下で公開されています。
韻律制御
句読点を使って生成される韻律を制御できます。例えば、カンマを使って音声に短い休止を入れることができます。

モデル能力

テキスト音声変換
音声特徴制御
韻律制御

使用事例

音声合成
個性化音声生成
ユーザーのニーズに応じて、異なる性別、話速、音程の音声を生成します。
自然で流れの良い個性化音声を生成します。
オーディオブック制作
テキスト内容を迅速に音声に変換し、オーディオブック制作に利用します。
高品質のオーディオコンテンツを効率的に生成します。
支援技術
音声支援デバイス
視覚障害者や音声支援が必要なユーザーにサポートを提供します。
明瞭で理解しやすい音声出力を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase