K

Kokorotts

Daemontatoxによって開発
Kokoroは8200万のパラメータを持つオープンソースのテキスト音声変換モデルで、軽量なアーキテクチャで大型モデルに匹敵する音質を提供し、同時に速度とコスト効率を大幅に向上させます。
ダウンロード数 78
リリース時間 : 2/27/2025

モデル概要

KokoroはStyleTTS2アーキテクチャに基づく多言語テキスト音声変換モデルで、8つの言語と54種類の音色をサポートし、本番環境から個人プロジェクトまで様々なデプロイメントシナリオに適しています。

モデル特徴

軽量で効率的
わずか8200万のパラメータの軽量なアーキテクチャで、大型モデルに匹敵する音質を提供します。
多言語サポート
8つの言語と54種類の音色をサポートし、多様なニーズを満たします。
オープンソースライセンス
Apache-2.0ライセンスを採用しており、商用および個人プロジェクトに自由にデプロイできます。
低コストトレーニング
わずか1000ドルのトレーニングコスト(1000 A100 GPU時間)です。

モデル能力

高品質なテキスト音声変換
多言語音声合成
音色切り替え
話速調整

使用事例

コンテンツ作成
オーディオブック生成
文字コンテンツを自然な音声に変換します。
複数の言語と音色の選択をサポートします。
支援技術
音声支援アプリケーション
視覚障害者に音声出力機能を提供します。
軽量なモデルはモバイル端末でのデプロイに適しています。
教育
言語学習ツール
多言語の発音デモを生成します。
8つの言語の正確な発音をサポートします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase