L

Llasa 3B

由unsloth開發
Llasa是一個基於LLaMA的文本轉語音(TTS)系統,通過整合語音標記擴展了語言模型的能力,支持中英文語音生成。
下載量 55
發布時間 : 5/15/2025

模型概述

Llasa是一個文本轉語音(TTS)系統,通過整合來自XCodec2碼本的65,536個語音標記,擴展了基於文本的LLaMA語言模型。該模型能夠僅從輸入文本或利用給定的語音提示生成語音。

模型特點

訓練時和推理時計算擴展
支持在訓練和推理階段進行擴展計算,提高模型性能
多語言支持
支持中文和英文的語音生成
語音提示生成
能夠利用給定的語音提示生成語音
高效訓練
訓練TTS類似於訓練LLM,可利用現有LLM的壓縮、加速和微調方法

模型能力

文本轉語音
語音提示生成
中英文語音合成

使用案例

語音合成
語音助手
為虛擬助手生成自然語音
生成高質量的語音輸出
有聲讀物
將文本內容轉換為語音
生成自然流暢的語音
語音提示應用
語音風格轉換
根據給定的語音提示生成相似風格的語音
保持語音風格一致性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase