K

Kokoro

Developed by geneing
Kokoroは最先端のテキスト読み上げ(TTS)モデルで、8200万のパラメータを持ち、Apache 2.0ライセンスで公開されています。TTS Spaces Arenaで1位を獲得し、より少ないパラメータとデータで高いEloスコアを達成しました。
Downloads 37
Release Time : 1/1/2025

Model Overview

Kokoroは高性能なテキスト読み上げモデルで、アメリカ英語とイギリス英語をサポートし、高品質な音声出力を生成できます。

Model Features

効率的なパラメータ利用
8200万パラメータと100時間未満のトレーニングデータで、TTS Spaces Arenaで1位を獲得し、効率的なパラメータ利用能力を示しました。
マルチボイスサポート
10個のユニークなボイスパックを提供し、異なるボイススタイルとアクセントをサポートします。
オープンソースライセンス
Apache 2.0ライセンスを採用しており、自由に使用および変更できます。

Model Capabilities

テキスト読み上げ
マルチボイスパックサポート
高品質音声生成

Use Cases

音声合成
音声アシスタント
音声アシスタントの自然な音声応答を生成するために使用されます。
高品質な音声出力で、人間の発音に近いです。
オーディオブック
テキストコンテンツを音声に変換し、オーディオブックの制作に使用されます。
滑らかな音声出力で、長時間のリスニングに適しています。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase