H

Hubert Large Audioset

Developed by ALM
基於HuBERT架構的Transformer模型,在完整AudioSet數據集上進行預訓練,適用於通用音頻表徵學習任務。
Downloads 79
Release Time : 8/28/2023

Model Overview

該模型基於HuBERT架構,在多樣化的AudioSet數據集上預訓練,能夠提取通用音頻特徵,適用於多種音頻處理任務。

Model Features

通用音頻表徵
在多樣化的AudioSet數據集上預訓練,能夠處理各種音頻類型(語音、音樂、環境聲等)
基於HuBERT架構
採用HuBERT的自監督學習方法,有效捕捉音頻信號的時序特徵
遷移學習友好
可作為特徵提取器或在下游任務上進行微調

Model Capabilities

音頻特徵提取
音樂分類
聲學事件檢測
語音識別(有限能力)

Use Cases

音樂分析
音樂流派分類
使用模型提取的特徵進行音樂流派自動分類
環境聲音分析
聲學事件檢測
檢測環境中的特定聲音事件(如警報聲、動物叫聲等)
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase