K

Kokoro 82M

Developed by prince-canuma
Kokoro是一款擁有8200萬參數的開源TTS模型,音質媲美更大模型,同時具備顯著的速度優勢和成本效益。
Downloads 376
Release Time : 2/26/2025

Model Overview

Kokoro是一款輕量級文本轉語音模型,基於StyleTTS2架構,支持多種語言和音色,適用於生產環境和個人項目。

Model Features

輕量高效
8200萬參數的輕量架構,在保持高質量音質的同時具備快速推理能力
多語言支持
支持8種語言和54種音色,滿足多樣化需求
開源許可
採用Apache-2.0許可證,可自由用於商業和個人項目
低成本訓練
僅需1000美元訓練成本,使用A100 GPU完成訓練

Model Capabilities

高質量語音合成
多語言語音生成
音色切換
語速調節

Use Cases

內容創作
有聲讀物生成
將文本內容轉換為自然語音
生成高質量、富有表現力的語音
視頻配音
為視頻內容添加多語言配音
支持多種語言和音色的語音輸出
輔助技術
語音輔助應用
為視障用戶提供文本朗讀功能
生成清晰自然的語音輸出
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase