K

Kokoro

geneingによって開発
Kokoroは最先端のテキスト読み上げ(TTS)モデルで、8200万のパラメータを持ち、Apache 2.0ライセンスで公開されています。TTS Spaces Arenaで1位を獲得し、より少ないパラメータとデータで高いEloスコアを達成しました。
ダウンロード数 37
リリース時間 : 1/1/2025

モデル概要

Kokoroは高性能なテキスト読み上げモデルで、アメリカ英語とイギリス英語をサポートし、高品質な音声出力を生成できます。

モデル特徴

効率的なパラメータ利用
8200万パラメータと100時間未満のトレーニングデータで、TTS Spaces Arenaで1位を獲得し、効率的なパラメータ利用能力を示しました。
マルチボイスサポート
10個のユニークなボイスパックを提供し、異なるボイススタイルとアクセントをサポートします。
オープンソースライセンス
Apache 2.0ライセンスを採用しており、自由に使用および変更できます。

モデル能力

テキスト読み上げ
マルチボイスパックサポート
高品質音声生成

使用事例

音声合成
音声アシスタント
音声アシスタントの自然な音声応答を生成するために使用されます。
高品質な音声出力で、人間の発音に近いです。
オーディオブック
テキストコンテンツを音声に変換し、オーディオブックの制作に使用されます。
滑らかな音声出力で、長時間のリスニングに適しています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase