W

Wav2vec2 Base Audioset

由 ALM 开发
基于HuBERT架构的音频表征学习模型,在完整AudioSet数据集上预训练完成
下载量 2,191
发布时间 : 9/5/2023

模型简介

该模型采用HuBERT架构,通过自监督学习方式从AudioSet数据集中提取通用音频特征,适用于多种音频处理任务。

模型特点

通用音频表征
能够从多样化音频内容中学习通用特征表示
自监督预训练
采用自监督学习方式在AudioSet数据集上进行预训练
Transformer架构
基于HuBERT的Transformer架构,具有强大的特征提取能力

模型能力

音频特征提取
音乐分类
声学事件检测
语音识别辅助

使用案例

音频分析
音乐分类
对音乐片段进行流派或情绪分类
环境声音检测
识别环境中的特定声音事件(如警报声、动物叫声等)
语音处理
语音识别辅助
作为语音识别系统的前端特征提取器
可能不如专用语音模型表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase