ast-finetuned-audioset-10-10-0.4593-ONNX開源模型

首頁

Ast Finetuned Audioset 10 10 0.4593 ONNX

由onnx-community開發

這是AST(Audio Spectrogram Transformer)模型的ONNX版本，專為音頻分類任務設計，在AudioSet數據集上進行了微調。

音頻分類

Transformers

#音頻分類 #ONNX優化 #Audioset微調

下載量 684

發布時間 : 5/1/2025

模型概述

該模型是基於Transformer架構的音頻分類模型，通過將音頻轉換為頻譜圖進行處理，適用於各種音頻識別和分類任務。

模型特點

ONNX格式

模型已轉換為ONNX格式，便於在不同平臺和框架中部署使用

音頻分類

專門針對音頻分類任務優化的Transformer模型

頻譜圖處理

將音頻信號轉換為頻譜圖進行高效處理

模型能力

音頻分類

聲音事件檢測

音頻特徵提取

使用案例

多媒體分析

聲音事件檢測

識別和分類音頻中的特定聲音事件

在AudioSet數據集上達到0.4593的mAP

內容分類

對音頻內容進行分類，如音樂、語音、環境聲等

智能監控

異常聲音檢測

檢測監控音頻中的異常或危險聲音

屬性	詳情
庫名稱	transformers.js
基礎模型	MIT/ast - finetuned - audioset - 10 - 10 - 0.4593

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Ast Finetuned Audioset 10 10 0.4593 ONNX

模型概述

模型特點

模型能力

使用案例

🚀 ast - finetuned - audioset - 10 - 10 - 0.4593 (ONNX)

📚 詳細文檔