SARA_TTSオープンソーステキストトゥースピーチモデル - アゼルバイジャン語のテキストを無料で自然な音声に変換

ホーム

SARA TTS

BHOSAIによって開発

バクー高等石油学校人工知能研究開発センターとPRODATAが共同で開発したアゼルバイジャン語テキスト音声変換モデル。VITSアーキテクチャを基にし、Meta MMSモデルを参考にしています。

音声合成

Transformers

その他#アゼルバイジャン語TTS #VITSアーキテクチャ最適化 #長文音声合成

ダウンロード数 173

リリース時間 : 7/30/2024

モデル概要

このモデルはアゼルバイジャン語のテキスト音声変換タスクに特化しており、入力トークンの頑健性を改善することで音声の自然さとイントネーションの安定性を向上させています。

モデル特徴

改善された頑健性

入力トークン処理を最適化し、元のMeta MMSモデルが入力トークンの変化に敏感だった問題を解決し、イントネーションをより安定させました。

高品質音声合成

VITSアーキテクチャに基づき、自然度の高いアゼルバイジャン語音声を生成できます。

データ拡張

2-3の文を組み合わせて一貫性のある入力音声を生成することで、モデルの文脈処理能力を向上させました。

モデル能力

アゼルバイジャン語テキスト音声変換

自然音声合成

使用事例

音声アシスタント

アゼルバイジャン語音声アシスタント

アゼルバイジャン語ユーザーにローカライズされた音声インタラクション体験を提供します。

自然で流暢なアゼルバイジャン語音声応答を生成

教育テクノロジー

言語学習ツール

学習者がアゼルバイジャン語の発音とリスニングを練習するのを支援します。

正確なアゼルバイジャン語発音の手本を提供

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

SARA TTS

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Voice of SARA

✨ 主な機能

📚 ドキュメント

📄 ライセンス