# 軽量音声モデル

Yarngpt2
Apache-2.0
YarnGPT2はナイジェリアアクセントの言語(ヨルバ語、イボ語、ハウサ語及び英語)を合成するために特別に設計されたテキスト読み上げ(TTS)モデルです。
音声合成 Transformers 英語
Y
saheedniyi
2,023
4
Wav2vec2 Base BirdSet XCL
wav2vec 2.0 は音声表現学習のための自己教師あり学習フレームワークで、ラベル付けされていない音声データから音声特徴を学習できます。
音声分類 Transformers
W
DBD-research-group
177
0
Parler Tts
Apache-2.0
Parler-TTS Mini v0.1は軽量のテキスト音声変換モデルで、10.5K時間の音声データを基に訓練され、高品質で自然な流れの良い音声を生成でき、簡単なテキストプロンプトで音声の特徴を制御できます。
音声合成 Transformers 英語
P
ipsilondev
18
4
Mms Spa Finetuned Colombian Monospeaker
これはMMSベースのスペイン語TTSモデルで、VITSアーキテクチャを使用してファインチューニングされており、わずか80-150のサンプルと20分のトレーニング時間でコロンビアアクセントのスペイン語音声を生成できます。
音声合成 Transformers スペイン語
M
ylacombe
71
1
Distilhubert Finetuned Gtzan
Apache-2.0
DistilHuBERTをGTZAN音楽分類データセットでファインチューニングした軽量音響特徴抽出モデル
音声分類 Transformers
D
mory91
48
0
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはGTZAN音楽分類データセットで微調整されたDistilHuBERTベースの音声分類モデルで、精度は88%です
音声分類 Transformers
D
Isaacgv
22
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase