H

Hubert Large Audioset

由ALM開發
基於HuBERT架構的Transformer模型,在完整AudioSet數據集上進行預訓練,適用於通用音頻表徵學習任務。
下載量 79
發布時間 : 8/28/2023

模型概述

該模型基於HuBERT架構,在多樣化的AudioSet數據集上預訓練,能夠提取通用音頻特徵,適用於多種音頻處理任務。

模型特點

通用音頻表徵
在多樣化的AudioSet數據集上預訓練,能夠處理各種音頻類型(語音、音樂、環境聲等)
基於HuBERT架構
採用HuBERT的自監督學習方法,有效捕捉音頻信號的時序特徵
遷移學習友好
可作為特徵提取器或在下游任務上進行微調

模型能力

音頻特徵提取
音樂分類
聲學事件檢測
語音識別(有限能力)

使用案例

音樂分析
音樂流派分類
使用模型提取的特徵進行音樂流派自動分類
環境聲音分析
聲學事件檢測
檢測環境中的特定聲音事件(如警報聲、動物叫聲等)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase