K

Kokoro 82M

Developed by hexgrad
Kokoro是一款拥有8200万参数的开源文本转语音(TTS)模型,以其轻量级架构和高音质著称,同时具备快速和成本效益高的特点。
Downloads 2.0M
Release Time : 12/26/2024

Model Overview

Kokoro是一款基于Apache许可的文本转语音模型,能够生成高质量的语音输出,适用于从生产环境到个人项目的各种场景。

Model Features

轻量级架构
尽管参数规模较小,但能提供与大型模型相媲美的音质。
高效成本
每百万字符文本输入低于1美元,每小时音频输出低于0.06美元。
多语言支持
支持8种语言和54种音色,适用于多样化的应用场景。
开源许可
采用Apache许可,允许自由部署于商业和个人项目。

Model Capabilities

文本转语音
多语言语音合成
高效音频生成

Use Cases

商业应用
语音助手
为商业应用提供高质量的语音输出。
高效且成本低廉的语音合成方案。
有声读物
生成自然流畅的有声读物内容。
高质量的多语言语音输出。
个人项目
个人语音助手
为个人项目提供定制化的语音输出。
轻量级且易于部署的解决方案。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase