D

Distil Ast Audioset

由bookbot開發
基於音頻頻譜變換器架構的音頻分類模型,是對原版AST AudioSet模型的蒸餾版本,適用於音頻分類任務。
下載量 917
發布時間 : 3/20/2023

模型概述

該模型是對MIT/ast-finetuned-audioset-10-10-0.4593在AudioSet數據集上的蒸餾版本,主要用於音頻分類任務。

模型特點

蒸餾版模型
通過對原版AST AudioSet模型進行蒸餾,減少了模型參數量,同時保持了較好的性能。
高性能音頻分類
在AudioSet數據集上表現出色,F1值達到0.4876,ROC AUC為0.7140。
高效訓練
使用HuggingFace的PyTorch框架訓練,支持混合精度訓練,優化了訓練效率。

模型能力

音頻分類
頻譜分析
多標籤分類

使用案例

音頻處理
環境聲音分類
用於識別和分類環境中的各種聲音,如動物叫聲、交通工具聲等。
F1值達到0.4876,ROC AUC為0.7140。
音樂分類
用於對音樂進行分類,識別不同的音樂類型或樂器聲音。
平均精度(mAP)為0.4743。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase