T

Tts 1.6b En Fr

由kyutai開發
京都臺文本轉語音(TTS)模型是一款用於流式文本轉語音的模型,支持即時語音生成和多語言處理。
下載量 1,441
發布時間 : 6/30/2025

模型概述

該模型採用分層Transformer架構,支持英語和法語的流式文本轉語音生成,具有高效生成和語音調節功能。

模型特點

流式語音生成
無需等待完整文本輸入,接收到前幾個單詞後即可開始輸出音頻,提升即時性。
多語言支持
支持英語和法語兩種語言的文本轉語音。
高效生成
通過CFG蒸餾訓練提高生成速度,易於批量處理,每計算單位時間可生成75倍音頻。
語音調節
支持通過預計算的嵌入進行語音調節。

模型能力

流式文本轉語音
多語言語音生成
即時語音輸出
語音風格調節

使用案例

即時對話
對話場景語音生成
在對話場景中即時生成語音響應,提升交互體驗。
實現低延遲的語音輸出
多語言應用
多語言語音合成
為英語和法語內容生成自然語音。
支持兩種語言的流暢語音輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase