M

Mms Tts Khm

facebookによって開発
Facebook MMSプロジェクトのクメール語テキストトゥスピーチモデル、VITSアーキテクチャに基づくエンドツーエンド音声合成
ダウンロード数 217
リリース時間 : 9/1/2023

モデル概要

このモデルはクメール語(khm)のテキストトゥスピーチ(TTS)モデルで、Facebookの大規模多言語音声(MMS)プロジェクトの一部であり、クメール語の高品質な音声合成を提供することを目的としています。

モデル特徴

エンドツーエンド音声合成
VITSアーキテクチャに基づき、テキストから波形への直接的なエンドツーエンド変換を実現
多言語サポート
MMSプロジェクトの一部として、クメール語を含む複数言語の音声合成をサポート
変分推論と敵対的学習
変分下限と敵対的訓練の損失関数を組み合わせたエンドツーエンド訓練
ランダム持続時間予測
ランダム持続時間予測器により、同一テキストに対して異なるリズムの音声合成を実現

モデル能力

クメール語テキストトゥスピーチ
音声波形生成
多スタイル音声合成

使用事例

音声合成
音声アシスタント
クメール語音声アシスタントに自然な音声出力を提供
オーディオブック
クメール語テキストを音声に変換し、オーディオブック制作に利用
アクセシビリティアプリ
視覚障害者がクメール語テキストコンテンツを取得するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase