Speech-t5-urオープンソースウルドゥー語音声合成モデル

ホーム

Speech T5 Ur

Pak-Speech-Processingによって開発

microsoft/speecht5_ttsをfleursデータセットでファインチューニングしたウルドゥー語音声合成モデル

音声合成

Transformers

その他オープンソースライセンス:MIT #ウルドゥー語音声合成 #低リソースファインチューニング #SpeechT5アーキテクチャ

ダウンロード数 38

リリース時間 : 3/18/2024

モデル概要

このモデルはマイクロソフトのSpeechT5アーキテクチャのファインチューン版で、ウルドゥー語のテキスト音声変換タスクに特化しています。

モデル特徴

ウルドゥー語サポート

ウルドゥー語に最適化された音声合成機能

効率的なファインチューニング

事前学習済みSpeechT5モデルを基に効率的にファインチューニング

軽量トレーニング

比較的小さなトレーニングバッチとステップ数でファインチューニングを完了

モデル能力

ウルドゥー語テキストto音声変換

音声合成

使用事例

音声アプリケーション

ウルドゥー語音声アシスタント

ウルドゥー語ユーザー向け音声インタラクション機能を提供

オーディオブック生成

ウルドゥー語テキストを自然な音声に変換

トレーニング損失	エポック	ステップ	検証損失
0.7238	0.84	50	0.5677
0.6067	1.68	100	0.5185

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Speech T5 Ur

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ft-speech-t5-on-voxpopuli

🚀 クイックスタート

🔧 技術詳細

トレーニングのハイパーパラメータ

トレーニング結果

フレームワークのバージョン

📄 ライセンス