C

Csm Expressiva 1b

由senstella開發
基於CSM-1b對話語音模型微調的情感語音模型,支持耳語風格語音合成
下載量 105
發布時間 : 4/10/2025

模型概述

本模型通過SFT微調CSM基礎模型,採用Expresso數據集中的耳語風格語音數據,驗證了csm-mlx代碼庫的LoRA微調效果,能夠生成具有特定情感特徵的語音。

模型特點

耳語風格語音合成
能夠生成具有特定耳語風格的情感語音
LoRA微調優化
使用低秩適應(LoRA)技術進行高效微調,保持基礎模型能力的同時添加新特徵
輕量級訓練
可在16GB內存的MacBook Air上完成訓練,適合資源有限的環境
穩定性提升
通過微調顯著減少了基礎模型的典型故障(如無限靜音)

模型能力

文本轉語音
情感語音合成
耳語風格生成

使用案例

語音合成
情感化語音助手
為語音助手添加耳語等情感化語音輸出能力
能夠生成自然的情感語音
有聲內容創作
為有聲書、播客等內容創作提供多樣化語音風格
可生成特定風格的語音內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase