E

Erax Smile UnixSex F5

erax-aiによって開発
F5-TTSアーキテクチャに基づくベトナム語テキスト音声変換モデル、ニュートラルスタイルの音声クローンをサポート
ダウンロード数 120
リリース時間 : 4/18/2025

モデル概要

これはF5-TTSアーキテクチャに基づくベトナム語テキスト音声変換モデルで、2,700,000以上のベトナム語サンプルで微調整されており、ニュートラルスタイルの音声クローンとゼロショット音声クローン機能をサポートしています。

モデル特徴

ベトナム語サポート
ベトナム語に特化して最適化され、大量のベトナム語サンプルでトレーニングされています
音声クローン
ゼロショット音声クローン機能をサポートし、参照音声に基づいて類似音声を生成できます
マルチスタイルサポート
女性声、男性声、ニュートラルスタイルの音声生成をサポート
オープンソースコード
完全なオープンソース実装コードを提供し、研究や二次開発が容易です

モデル能力

ベトナム語テキスト音声変換
音声スタイルクローン
ニュートラル音声生成
マルチスタイル音声合成

使用事例

音声合成
ニュース放送
自然で流暢なベトナム語ニュース放送音声を生成
モデルページで提供されている音声サンプルを参照
オーディオブック
ベトナム語電子書籍の朗読音声を生成
音声クローン
パーソナライズド音声アシスタント
特定人物の音声をクローンして個別化音声アシスタントを作成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase