K

Kokorotts

Developed by Daemontatox
Kokoroは8200万のパラメータを持つオープンソースのテキスト音声変換モデルで、軽量なアーキテクチャで大型モデルに匹敵する音質を提供し、同時に速度とコスト効率を大幅に向上させます。
Downloads 78
Release Time : 2/27/2025

Model Overview

KokoroはStyleTTS2アーキテクチャに基づく多言語テキスト音声変換モデルで、8つの言語と54種類の音色をサポートし、本番環境から個人プロジェクトまで様々なデプロイメントシナリオに適しています。

Model Features

軽量で効率的
わずか8200万のパラメータの軽量なアーキテクチャで、大型モデルに匹敵する音質を提供します。
多言語サポート
8つの言語と54種類の音色をサポートし、多様なニーズを満たします。
オープンソースライセンス
Apache-2.0ライセンスを採用しており、商用および個人プロジェクトに自由にデプロイできます。
低コストトレーニング
わずか1000ドルのトレーニングコスト(1000 A100 GPU時間)です。

Model Capabilities

高品質なテキスト音声変換
多言語音声合成
音色切り替え
話速調整

Use Cases

コンテンツ作成
オーディオブック生成
文字コンテンツを自然な音声に変換します。
複数の言語と音色の選択をサポートします。
支援技術
音声支援アプリケーション
視覚障害者に音声出力機能を提供します。
軽量なモデルはモバイル端末でのデプロイに適しています。
教育
言語学習ツール
多言語の発音デモを生成します。
8つの言語の正確な発音をサポートします。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase