A

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50

由 xpariz10 开发
该模型是基于AST架构在AudioSet数据集上预训练,并在ESC-50数据集上微调的音频分类模型,在评估集上取得了94.64%的准确率。
下载量 24
发布时间 : 12/7/2022

模型简介

一个用于音频分类的深度学习模型,特别适用于环境声音分类任务。

模型特点

高准确率
在ESC-50评估集上达到94.64%的分类准确率
基于Transformer架构
采用AST(Audio Spectrogram Transformer)架构处理音频数据
迁移学习
先在AudioSet数据集上预训练,再在ESC-50上微调

模型能力

环境声音分类
音频特征提取
声音事件检测

使用案例

环境监测
城市声音分类
识别和分类城市环境中的各种声音
可准确识别交通、建筑、自然等多种环境声音
智能家居
家庭异常声音检测
检测家庭环境中的异常声音如玻璃破碎、警报等
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase