K

Kokoro 82M

由hexgrad開發
Kokoro是一款擁有8200萬參數的開源文本轉語音(TTS)模型,以其輕量級架構和高音質著稱,同時具備快速和成本效益高的特點。
下載量 2.0M
發布時間 : 12/26/2024

模型概述

Kokoro是一款基於Apache許可的文本轉語音模型,能夠生成高質量的語音輸出,適用於從生產環境到個人項目的各種場景。

模型特點

輕量級架構
儘管參數規模較小,但能提供與大型模型相媲美的音質。
高效成本
每百萬字符文本輸入低於1美元,每小時音頻輸出低於0.06美元。
多語言支持
支持8種語言和54種音色,適用於多樣化的應用場景。
開源許可
採用Apache許可,允許自由部署於商業和個人項目。

模型能力

文本轉語音
多語言語音合成
高效音頻生成

使用案例

商業應用
語音助手
為商業應用提供高質量的語音輸出。
高效且成本低廉的語音合成方案。
有聲讀物
生成自然流暢的有聲讀物內容。
高質量的多語言語音輸出。
個人項目
個人語音助手
為個人項目提供定製化的語音輸出。
輕量級且易於部署的解決方案。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase