L

Llasa 3B

Developed by unsloth
Llasa是一個基於LLaMA的文本轉語音(TTS)系統,通過整合語音標記擴展了語言模型的能力,支持中英文語音生成。
Downloads 55
Release Time : 5/15/2025

Model Overview

Llasa是一個文本轉語音(TTS)系統,通過整合來自XCodec2碼本的65,536個語音標記,擴展了基於文本的LLaMA語言模型。該模型能夠僅從輸入文本或利用給定的語音提示生成語音。

Model Features

訓練時和推理時計算擴展
支持在訓練和推理階段進行擴展計算,提高模型性能
多語言支持
支持中文和英文的語音生成
語音提示生成
能夠利用給定的語音提示生成語音
高效訓練
訓練TTS類似於訓練LLM,可利用現有LLM的壓縮、加速和微調方法

Model Capabilities

文本轉語音
語音提示生成
中英文語音合成

Use Cases

語音合成
語音助手
為虛擬助手生成自然語音
生成高質量的語音輸出
有聲讀物
將文本內容轉換為語音
生成自然流暢的語音
語音提示應用
語音風格轉換
根據給定的語音提示生成相似風格的語音
保持語音風格一致性
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase