A

Ast Finetuned Audioset 10 10 0.4593 ONNX

由onnx-community開發
這是AST(Audio Spectrogram Transformer)模型的ONNX版本,專為音頻分類任務設計,在AudioSet數據集上進行了微調。
下載量 684
發布時間 : 5/1/2025

模型概述

該模型是基於Transformer架構的音頻分類模型,通過將音頻轉換為頻譜圖進行處理,適用於各種音頻識別和分類任務。

模型特點

ONNX格式
模型已轉換為ONNX格式,便於在不同平臺和框架中部署使用
音頻分類
專門針對音頻分類任務優化的Transformer模型
頻譜圖處理
將音頻信號轉換為頻譜圖進行高效處理

模型能力

音頻分類
聲音事件檢測
音頻特徵提取

使用案例

多媒體分析
聲音事件檢測
識別和分類音頻中的特定聲音事件
在AudioSet數據集上達到0.4593的mAP
內容分類
對音頻內容進行分類,如音樂、語音、環境聲等
智能監控
異常聲音檢測
檢測監控音頻中的異常或危險聲音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase