# オープンソース音声モデル

Kokorotts
Apache-2.0
Kokoroは8200万のパラメータを持つオープンソースのテキスト音声変換モデルで、軽量なアーキテクチャで大型モデルに匹敵する音質を提供し、同時に速度とコスト効率を大幅に向上させます。
音声合成 英語
K
Daemontatox
78
0
Kokoro 82M
Apache-2.0
Kokoroは8200万パラメータのオープンソースTTSモデルで、音質はより大規模なモデルに匹敵しつつ、顕著な速度優位性とコスト効率を備えています。
音声合成 英語
K
prince-canuma
376
2
W2v Bert Uk V2.1
Apache-2.0
facebook/w2v-bert-2.0を基にしたウクライナ語音声認識モデル、Yehor/openstt-ukデータセットでファインチューニング
音声認識 Transformers その他
W
Yehor
492
1
Parler Tts Mini V0.1
Apache-2.0
Parler-TTS Miniは軽量なテキスト読み上げモデルで、10.5K時間の音声データでトレーニングされ、テキストプロンプトによる音声特徴の制御をサポートします。
音声合成 Transformers 英語
P
parler-tts
5,430
352
Silero Model V3 Ru
Silero 音声モデルはロシア語に特化したテキスト読み上げ(TTS)モデルで、snakers4によって開発されオープンソース化されました。
音声合成 Transformers その他
S
imperialwool
22
4
W2v Xls R Uk
Apache-2.0
facebook/wav2vec2-xls-r-300mを基にしたウクライナ語自動音声認識モデル、Common Voice 10.0データセットでトレーニング
音声認識 Transformers その他
W
Yehor
231.46k
8
Kan Bayashi Ljspeech Vits
ESPnetフレームワークに基づいて訓練されたVITSテキスト音声変換モデルで、LJSpeechデータセットを使用して訓練され、英語の音声合成をサポートします。
音声合成 英語
K
espnet
2,780
224
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase