K

Kokoro 82M

由prince-canuma開發
Kokoro是一款擁有8200萬參數的開源TTS模型,音質媲美更大模型,同時具備顯著的速度優勢和成本效益。
下載量 376
發布時間 : 2/26/2025

模型概述

Kokoro是一款輕量級文本轉語音模型,基於StyleTTS2架構,支持多種語言和音色,適用於生產環境和個人項目。

模型特點

輕量高效
8200萬參數的輕量架構,在保持高質量音質的同時具備快速推理能力
多語言支持
支持8種語言和54種音色,滿足多樣化需求
開源許可
採用Apache-2.0許可證,可自由用於商業和個人項目
低成本訓練
僅需1000美元訓練成本,使用A100 GPU完成訓練

模型能力

高質量語音合成
多語言語音生成
音色切換
語速調節

使用案例

內容創作
有聲讀物生成
將文本內容轉換為自然語音
生成高質量、富有表現力的語音
視頻配音
為視頻內容添加多語言配音
支持多種語言和音色的語音輸出
輔助技術
語音輔助應用
為視障用戶提供文本朗讀功能
生成清晰自然的語音輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase