K

Kokorotts

由Daemontatox開發
Kokoro是一款擁有8200萬參數的開源文本轉語音模型,以輕量架構提供媲美大型模型的音質,同時顯著提升速度和成本效益。
下載量 78
發布時間 : 2/27/2025

模型概述

Kokoro是基於StyleTTS2架構的多語言文本轉語音模型,支持8種語言和54種音色,適用於從生產環境到個人項目的各種部署場景。

模型特點

輕量高效
僅8200萬參數的輕量架構,卻能提供與大型模型相媲美的音質
多語言支持
支持8種語言和54種音色,滿足多樣化需求
開源許可
採用Apache-2.0許可,可自由部署於商業和個人項目
低成本訓練
僅需1000美元訓練成本(1000 A100 GPU小時)

模型能力

高質量文本轉語音
多語言語音合成
音色切換
語速調節

使用案例

內容創作
有聲讀物生成
將文字內容轉換為自然語音
支持多種語言和音色選擇
輔助技術
語音輔助應用
為視障用戶提供語音輸出功能
輕量模型適合移動端部署
教育
語言學習工具
生成多語言發音示範
支持8種語言的準確發音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase