H

Hubert Base Audioset

Developed by ALM
基于HuBERT架构的音频表征模型,在完整AudioSet数据集上预训练,适用于通用音频任务
Downloads 345
Release Time : 8/29/2023

Model Overview

该模型采用HuBERT架构,在完整AudioSet数据集上进行预训练,能够提取通用音频特征,适用于多种音频处理任务

Model Features

AudioSet完整数据集预训练
使用完整的AudioSet数据集进行预训练,覆盖广泛的音频类别
通用音频表征
学习到的特征适用于多种音频任务,包括音乐分类和声学事件检测
HuBERT架构优势
利用HuBERT的自监督学习框架,有效捕捉音频信号的潜在特征

Model Capabilities

音频特征提取
音乐分类
声学事件检测
语音识别辅助

Use Cases

音频分析
音乐流派分类
提取音乐音频特征用于流派分类
环境声音识别
识别环境中的特定声音事件
语音处理
语音识别辅助
作为语音识别系统的前端特征提取器
效果可能逊于专用语音模型
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase