K

Kokoro 82M Light

ctranslate2-4youによって開発
StyleTTS2-LJSpeechをベースにしたクローン版で、英語テキスト読み上げタスク向けに最適化され、一部の依存関係を削除して展開を簡素化しました。
ダウンロード数 21
リリース時間 : 1/28/2025

モデル概要

これはテキスト読み上げ(TTS)モデルで、高品質な英語音声出力の生成に特化しています。オリジナル版と比較し、このリポジトリでは一部の依存関係を削除し、インストールと使用プロセスを簡略化しました。

モデル特徴

依存関係の簡素化
munchとphonemizerの依存関係を削除し、espeakを直接呼び出すように変更することで、依存関係の数を大幅に削減しました
英語発音の最適化
expand_acronym()関数を追加し、NASAなどの特定の語彙の発音を改善しました
軽量展開
v1.0版と比較して約80の依存関係を削減し、98%の品質を維持しながら展開を簡素化しました

モデル能力

英語テキスト読み上げ
イギリス英語音声合成
略語発音の最適化

使用事例

音声合成
オーディオブック生成
英文テキストを自然な音声に変換し、オーディオブック制作に使用
人間の発音に近い音声出力を生成
音声アシスタント
英語音声アシスタントに音声合成機能を提供
流暢で自然な英語音声応答
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase