L

Llama OuteTTS 1.0 1B

由unsloth開發
OuteTTS 1.0是一個基於Llama架構的多語言文本轉語音模型,支持20種語言,具有高質量的語音合成和語音克隆能力。
下載量 233
發布時間 : 5/15/2025

模型概述

這是一個1B參數的文本轉語音模型,採用DAC音頻編碼器實現高質量語音合成,支持單次語音克隆和自動文本對齊功能。

模型特點

多語言支持
支持23種語言的文本轉語音,包括主要歐洲和亞洲語言
高質量語音合成
採用DAC音頻編碼器實現高保真語音輸出
單次語音克隆
僅需約10秒參考音頻即可生成準確的語音表徵
自動文本對齊
自動處理詞對齊,無需預處理文本
高效推理
在Unsloth框架下運行速度提升1.5倍,內存使用減少58%

模型能力

文本轉語音
語音克隆
多語言合成
自動文本對齊
高質量音頻生成

使用案例

語音合成
有聲讀物生成
將文本內容轉換為自然語音
高質量、自然的語音輸出
語音助手
為虛擬助手提供多語言語音支持
支持23種語言的語音交互
語音克隆
個性化語音合成
基於少量樣本克隆特定說話人的聲音
僅需10秒音頻即可生成相似語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase