L

Llama OuteTTS 1.0 1B

Developed by unsloth
OuteTTS 1.0是一個基於Llama架構的多語言文本轉語音模型,支持20種語言,具有高質量的語音合成和語音克隆能力。
Downloads 233
Release Time : 5/15/2025

Model Overview

這是一個1B參數的文本轉語音模型,採用DAC音頻編碼器實現高質量語音合成,支持單次語音克隆和自動文本對齊功能。

Model Features

多語言支持
支持23種語言的文本轉語音,包括主要歐洲和亞洲語言
高質量語音合成
採用DAC音頻編碼器實現高保真語音輸出
單次語音克隆
僅需約10秒參考音頻即可生成準確的語音表徵
自動文本對齊
自動處理詞對齊,無需預處理文本
高效推理
在Unsloth框架下運行速度提升1.5倍,內存使用減少58%

Model Capabilities

文本轉語音
語音克隆
多語言合成
自動文本對齊
高質量音頻生成

Use Cases

語音合成
有聲讀物生成
將文本內容轉換為自然語音
高質量、自然的語音輸出
語音助手
為虛擬助手提供多語言語音支持
支持23種語言的語音交互
語音克隆
個性化語音合成
基於少量樣本克隆特定說話人的聲音
僅需10秒音頻即可生成相似語音
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase