M

Mhubert Base 25hz

由 slprl 开发
Meta公司Hubert模型的一个版本,在TWIST论文中提出,作为训练SpeechLMs的语音标记器展现出重要价值。
下载量 10.63k
发布时间 : 10/24/2024

模型简介

该Hubert模型用于语音特征提取,适用于口语语言建模或说话风格转换等场景。

模型特点

25Hz特征率
在CNN编码器添加了步长为2的卷积层,最终生成25Hz特征。
多语言支持
模型训练使用了多种多语言数据集组合。
语音标记器
在训练SpeechLMs时展现出重要价值。

模型能力

语音特征提取
口语语言建模
说话风格转换

使用案例

语音处理
口语语言建模
用于构建口语语言模型
说话风格转换
用于实现说话人风格转换
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase