ast-finetuned-audioset開源音頻分類模型 - 精準分類，免費部署暢享音頻處理便利

首頁

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50 Slower LR

由xpariz10開發

基於AST架構的音頻分類模型，在AudioSet數據集上預訓練後，在ESC-50數據集上微調

音頻分類

Transformers

開源協議:Bsd-3-clause #音頻分類 #高準確率 #遷移學習

下載量 22

發布時間 : 12/10/2022

模型概述

該模型是一個音頻分類模型，使用AST(Audio Spectrogram Transformer)架構，先在AudioSet數據集上進行預訓練，然後在ESC-50環境聲音分類數據集上進行微調。

模型特點

基於Transformer的音頻處理

採用AST架構，將Transformer成功應用於音頻頻譜圖處理

兩階段訓練

先在大型AudioSet數據集上預訓練，再在ESC-50數據集上微調

高準確率

在評估集上達到89.29%的準確率

模型能力

音頻分類

環境聲音識別

聲音事件檢測

使用案例

智能家居

家電聲音識別

識別家中不同電器設備的聲音

環境監測

自然環境聲音分類

識別森林、城市等不同環境中的聲音

訓練損失	輪數	步數	驗證損失	準確率
9.3646	1.0	28	6.0136	0.0893
2.9631	2.0	56	2.0175	0.5357
1.2435	3.0	84	1.1471	0.7679
0.7699	4.0	112	0.8559	0.875
0.5911	5.0	140	0.7837	0.8929

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50 Slower LR

模型概述

模型特點

模型能力

使用案例

🚀 ast-finetuned-audioset-10-10-0.4593-finetuning-ESC-50-slower-LR

🚀 快速開始

🔧 技術細節

訓練超參數

訓練結果

框架版本

📄 許可證