K

Kokoro 82M Light

由ctranslate2-4you開發
基於StyleTTS2-LJSpeech的克隆版本,針對英語文本轉語音任務進行了優化,移除了部分依賴項以簡化部署。
下載量 21
發布時間 : 1/28/2025

模型概述

這是一個文本轉語音(TTS)模型,專注於生成高質量的英語語音輸出。相比原始版本,本倉庫移除了部分依賴項,簡化了安裝和使用流程。

模型特點

精簡依賴項
移除了munch和phonemizer依賴項,改為直接調用espeak,顯著減少了依賴項數量
英語發音優化
添加了expand_acronym()函數以改善特定詞彙(如NASA)的發音
輕量級部署
相比v1.0版本減少了約80個依賴項,在保持98%質量的同時簡化了部署

模型能力

英語文本轉語音
英式英語語音合成
縮寫詞發音優化

使用案例

語音合成
有聲讀物生成
將英文文本轉換為自然語音,用於有聲讀物製作
生成接近人類發音的語音輸出
語音助手
為英語語音助手提供語音合成能力
流暢自然的英語語音響應
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase