Swaram
S
Swaram
aoxoによって開発
Swaramは先進的なマラヤーラム語音声合成モデルで、入力テキストから高品質な音声波形を生成できます。
ダウンロード数 735
リリース時間 : 12/10/2024
モデル概要
このモデルは条件付き変分オートエンコーダ(VAE)アーキテクチャに基づいており、マラヤーラム語テキスト音声変換タスク向けに設計されており、自然で流暢な音声出力を生成できます。
モデル特徴
変分オートエンコーダアーキテクチャ
条件付き変分オートエンコーダをコアアーキテクチャとして採用し、音声合成における多様性を捉えることが可能
ランダム持続時間予測
組み込みのランダム持続時間予測器により、同じテキストでも異なるリズムの音声出力を生成可能
高品質波形生成
転置畳み込み層スタックを通じてスペクトログラムを高品質な音声波形に変換
モデル能力
マラヤーラム語テキスト音声変換
音声波形生成
多様な音声合成
使用事例
音声アプリケーション
音声アシスタント
マラヤーラム語音声アシスタントに自然な音声合成機能を提供
自然で流暢な音声出力を生成
オーディオブック
マラヤーラム語テキストを音声に変換してオーディオブック制作に利用
多様な発音スタイルをサポート
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98