F

F5 TTS Vietnamese 100h

Developed by hynt
F5-TTSを微調整したコンパクト版で、150時間のベトナム語音声データでトレーニングされており、研究用途のみに限定されます。
Downloads 123
Release Time : 3/23/2025

Model Overview

これはベトナム語に最適化されたテキスト読み上げ(TTS)モデルで、F5-TTSアーキテクチャを基に微調整されており、ベトナム語音声合成タスクに適しています。

Model Features

高品質なベトナム語音声合成
150時間の精選されたベトナム語音声データを使用してトレーニングされ、高品質な音声合成効果を提供します
厳格なデータ処理
demucsを使用して背景音楽を除去し、1秒未満または30秒を超える音声をフィルタリングしてデータ品質を保証します
学術協力データセット
VLSPシリーズデータセットとUEH大学が提供する50時間の高品質な注釈付きデータを含みます

Model Capabilities

ベトナム語テキスト読み上げ
音声合成
音声クローン(参照音声による)

Use Cases

学術研究
ベトナム語音声合成研究
音声合成技術の研究と実験に使用されます
教育応用
ベトナム語学習支援
ベトナム語学習者に発音の参考を提供します
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase