M

Mms Tts Cmo Script Khmer

facebookによって開発
Meta社が開発した中央クメール語テキスト音声合成モデルで、テキストを自然な音声に変換可能
ダウンロード数 142
リリース時間 : 9/1/2023

モデル概要

このモデルはMetaの大規模多言語音声(MMS)プロジェクトの一部で、中央クメール語(cmo-script_khmer)のテキスト音声合成タスク専用に設計されており、VITSエンドツーエンドアーキテクチャを採用

モデル特徴

エンドツーエンド音声合成
VITSアーキテクチャを採用し、中間特徴抽出なしで直接テキストから音声波形を生成
多言語サポート
MMSプロジェクトの一部として、複数言語の音声合成をサポート
表現力強化
ランダム期間予測器と正規化フロー技術により音声表現力を強化
高品質音声
HiFi-GANに似たデコーダー構造を採用し、高品質な音声波形を生成

モデル能力

テキスト音声合成
多言語音声合成
音声波形生成

使用事例

音声アプリケーション
音声アシスタント
中央クメール語ユーザー向けに音声インタラクション機能を提供
自然で流暢な中央クメール語音声を生成
オーディオブック
中央クメール語テキストを音声に変換
聴取可能な音声コンテンツを生成
音声ナビゲーション
中央クメール語地域向けに音声ナビゲーションを提供
明確なナビゲーション音声を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase