W

Wav2vec2 Large Audioset

由ALM開發
基於HuBERT架構的音頻表徵模型,在完整AudioSet數據集上預訓練,適用於通用音頻任務
下載量 43
發布時間 : 8/27/2023

模型概述

該模型採用HuBERT架構,基於完整AudioSet數據集進行預訓練,能夠提取高質量的音頻特徵表示

模型特點

AudioSet完整數據集預訓練
使用完整的AudioSet數據集進行預訓練,覆蓋廣泛的音頻類別
HuBERT架構優勢
採用HuBERT的自監督學習方法,能有效捕捉音頻中的潛在結構
通用音頻表徵
學習到的表徵適用於多種音頻任務,包括音樂、語音和環境聲音分析

模型能力

音頻特徵提取
音樂分類
聲學事件檢測
語音表示學習

使用案例

音頻分析
音樂流派分類
對音樂片段進行分類,識別其流派
環境聲音識別
識別錄音中的環境聲事件(如鳥鳴、警報等)
語音處理
語音情感識別
從語音中提取特徵用於情感分析
可能略遜於專門的語音預訓練模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase