K

Kokoro 82M

hexgradによって開発
Kokoroは8200万のパラメータを持つオープンソースのテキスト読み上げ(TTS)モデルで、軽量なアーキテクチャと高音質で知られ、高速かつコスト効率が高いという特徴があります。
ダウンロード数 2.0M
リリース時間 : 12/26/2024

モデル概要

KokoroはApacheライセンスに基づくテキスト読み上げモデルで、高品質の音声出力を生成でき、本番環境から個人プロジェクトまで様々なシナリオに適しています。

モデル特徴

軽量なアーキテクチャ
パラメータ規模が小さいにもかかわらず、大型モデルに匹敵する音質を提供します。
コスト効率が高い
100万文字のテキスト入力あたり1ドル未満、1時間の音声出力あたり0.06ドル未満です。
多言語対応
8言語と54種類の音色をサポートし、多様なアプリケーションシナリオに適しています。
オープンソースライセンス
Apacheライセンスを採用しており、商用および個人プロジェクトに自由にデプロイできます。

モデル能力

テキスト読み上げ
多言語音声合成
効率的な音声生成

使用事例

商用アプリケーション
音声アシスタント
商用アプリケーションに高品質の音声出力を提供します。
効率的で低コストの音声合成ソリューション。
オーディオブック
自然で流れるオーディオブックの内容を生成します。
高品質の多言語音声出力。
個人プロジェクト
個人用音声アシスタント
個人プロジェクトにカスタマイズされた音声出力を提供します。
軽量でデプロイが容易なソリューション。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase