cnn8rnn-audioset-sed开源声音检测模型 - 精准识别音频事件，免费部署

Home

Cnn8rnn Audioset Sed

Developed by wsntxxn

基于AudioSet预训练并在AudioSet-strong上微调的CRNN声音事件检测模型

音频分类

Safetensors

Open Source License:Apache-2.0 #音频事件检测 #多标签分类 #CRNN架构

Downloads 229

Release Time : 8/13/2024

Model Overview

这是一个用于声音事件检测的深度学习模型，能够识别音频中的特定事件类别，如语音、音乐或环境声音等。

Model Features

高时间分辨率

模型具有40毫秒的时间分辨率，能够精确检测音频事件的时间位置

多类别识别

可识别447种不同的音频事件类别，包括各种语音、音乐和环境声音

双输出模式

同时提供帧级输出和片段级输出，满足不同精度的检测需求

Model Capabilities

音频分类

声音事件检测

多类别音频识别

时间定位音频事件

Use Cases

音频内容分析

语音检测

检测音频中男性或女性语音的存在

可输出特定语音类别的概率序列

环境声音监测

识别环境中的特定声音事件，如警报声、动物叫声等

可标记声音事件的发生时间和类别

媒体内容分析

视频自动标记

通过分析视频中的音频轨道自动生成内容标签

提高视频内容检索效率

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Cnn8rnn Audioset Sed

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 CRNN音频事件检测模型

🚀 快速开始

💻 使用示例

基础用法

📄 许可证