M

Mms Tts Vie

facebookによって開発
Meta社が開発したベトナム語テキスト音声変換モデル、VITSアーキテクチャに基づき、高品質な音声合成をサポート
ダウンロード数 3,616
リリース時間 : 9/1/2023

モデル概要

このモデルはMetaの大規模多言語音声(MMS)プロジェクトの一部で、ベトナム語(vie)のテキスト音声変換タスク専用に設計され、VITSアーキテクチャを用いたエンドツーエンド音声合成を実現しています。

モデル特徴

エンドツーエンド音声合成
入力テキストから直接高品質な音声波形を生成、中間特徴抽出が不要
変分推論と敵対学習
VAEとGANの利点を組み合わせ、音声生成の自然さと表現力を向上
多言語サポート
MMSプロジェクトの一部として、複数言語の音声合成をサポート
ランダム時間長予測
ランダム時間長予測器により、同一テキストで異なるリズムの発音を実現

モデル能力

ベトナム語テキスト音声変換
高品質音声合成
可変リズム音声生成

使用事例

音声アプリケーション
音声アシスタント
ベトナム語音声アシスタントに自然な音声出力を提供
オーディオブック
ベトナム語テキストを音声に変換しオーディオブック制作に利用
アクセシビリティ技術
視覚障害者がベトナム語テキストコンテンツを取得するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase