EpXTTS音声生成モデル - オープンソース無料で、わずか6秒の音声クリップで多言語への声のクローンが可能

ホーム

Epxtts

epchannelによって開発

viⓍTTS は音声生成モデルで、6秒の短い音声クリップから異なる言語への音声クローンが可能です。

音声合成その他オープンソースライセンス:その他 #ベトナム語音声クローン #多言語音声合成 #短音声クローン

ダウンロード数 22

リリース時間 : 4/4/2025

モデル概要

XTTS-v2.0.3 モデルをベースにファインチューニングし、ベトナム語サポートを拡張、viVoice データセットでトレーニングされ、18言語の音声生成をサポートします。

モデル特徴

多言語サポート

ベトナム語、英語、中国語など18言語の音声生成をサポートします。

音声クローン

わずか6秒の音声クリップで異なる言語への音声クローンが可能です。

ベトナム語最適化

ベトナム語向けにトークナイザー拡張とデータセットトレーニングを特別に実施しました。

モデル能力

テキスト読み上げ

多言語音声生成

音声クローン

使用事例

音声合成

多言語音声アシスタント

異なる言語のユーザーにパーソナライズされた音声インタラクション体験を提供します。

音声コンテンツ制作

異なる言語の吹き替えコンテンツを迅速に生成します。

🚀 viⓍTTS

viⓍTTSは音声生成モデルで、わずか6秒の音声クリップを使用することで、音声をさまざまな言語にクローンすることができます。このモデルは、XTTS - v2.0.3モデルからさらに微調整され、トークナイザーをベトナム語に拡張し、viVoiceデータセットで学習されています。

✨ 主な機能

対応言語

viXTTSは18の言語をサポートしています。英語 (en)、スペイン語 (es)、フランス語 (fr)、ドイツ語 (de)、イタリア語 (it)、ポルトガル語 (pt)、ポーランド語 (pl)、トルコ語 (tr)、ロシア語 (ru)、オランダ語 (nl)、チェコ語 (cs)、アラビア語 (ar)、中国語 (zh - cn)、日本語 (ja)、ハンガリー語 (hu)、韓国語 (ko)、ヒンディー語 (hi)、ベトナム語 (vi) です。