Cnn8rnn Audioset Sed
C
Cnn8rnn Audioset Sed
Developed by wsntxxn
基于AudioSet预训练并在AudioSet-strong上微调的CRNN声音事件检测模型
Downloads 229
Release Time : 8/13/2024
Model Overview
这是一个用于声音事件检测的深度学习模型,能够识别音频中的特定事件类别,如语音、音乐或环境声音等。
Model Features
高时间分辨率
模型具有40毫秒的时间分辨率,能够精确检测音频事件的时间位置
多类别识别
可识别447种不同的音频事件类别,包括各种语音、音乐和环境声音
双输出模式
同时提供帧级输出和片段级输出,满足不同精度的检测需求
Model Capabilities
音频分类
声音事件检测
多类别音频识别
时间定位音频事件
Use Cases
音频内容分析
语音检测
检测音频中男性或女性语音的存在
可输出特定语音类别的概率序列
环境声音监测
识别环境中的特定声音事件,如警报声、动物叫声等
可标记声音事件的发生时间和类别
媒体内容分析
视频自动标记
通过分析视频中的音频轨道自动生成内容标签
提高视频内容检索效率
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98