A

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50

由xpariz10開發
該模型是基於AST架構在AudioSet數據集上預訓練,並在ESC-50數據集上微調的音頻分類模型,在評估集上取得了94.64%的準確率。
下載量 24
發布時間 : 12/7/2022

模型概述

一個用於音頻分類的深度學習模型,特別適用於環境聲音分類任務。

模型特點

高準確率
在ESC-50評估集上達到94.64%的分類準確率
基於Transformer架構
採用AST(Audio Spectrogram Transformer)架構處理音頻數據
遷移學習
先在AudioSet數據集上預訓練,再在ESC-50上微調

模型能力

環境聲音分類
音頻特徵提取
聲音事件檢測

使用案例

環境監測
城市聲音分類
識別和分類城市環境中的各種聲音
可準確識別交通、建築、自然等多種環境聲音
智能家居
家庭異常聲音檢測
檢測家庭環境中的異常聲音如玻璃破碎、警報等
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase