M

Matxa Tts Cat Multispeaker

projecte-ainaによって開発
Matcha-TTSアーキテクチャに基づくカタルーニャ語マルチスピーカーテキストトゥスピーチモデル、最適輸送条件フローマッチングトレーニングにより、高速高品質音声合成をサポート
ダウンロード数 21
リリース時間 : 3/28/2024

モデル概要

Matxa-TTSは非自己回帰のテキストトゥスピーチモデルで、カタルーニャ語向けに設計され、マルチスピーカー音声合成をサポートします。エンコーダ-デコーダアーキテクチャを採用し、最適輸送条件フローマッチングトレーニング手法を組み合わせることで、少ない合成ステップで高品質な音声出力を生成できます。

モデル特徴

マルチスピーカー対応
47のカタルーニャ語スピーカーの音声合成をサポート
高速高品質合成
最適輸送条件フローマッチングトレーニングを採用し、少ない合成ステップで高品質音声を生成
効率的なアーキテクチャ
TransformerベースのU-Netデコーダ構造、1D CNNを使用してメモリ消費を削減し合成速度を向上
言語固有の最適化
カタルーニャ語用音素器と専用データセットを使用して微調整し、現地語サポートを最適化

モデル能力

カタルーニャ語テキストトゥスピーチ
マルチスピーカー音声合成
調整可能な話速と生成温度
高品質音声出力

使用事例

音声合成アプリケーション
音声アシスタント
カタルーニャ語音声アシスタントに自然な音声出力を提供
複数のスピーカーの声から選択可能
オーディオブック
カタルーニャ語テキストを自然な音声に変換
必要に応じて話速とイントネーションを調整可能
支援技術
視覚障害者向けにカタルーニャ語テキスト読み上げ機能を提供
個人の好みに合わせて複数の声から選択可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase