S

Silero Vad Coreml

由 FluidInference 开发
CoreML Silero VAD是Silero语音活动检测(VAD)模型的CoreML实现,专为苹果平台(iOS/macOS)进行了优化,提供实时语音活动检测功能。
下载量 461
发布时间 : 7/7/2025

模型简介

该模型用于检测音频中是否存在语音活动,适用于实时语音处理、自动语音识别(ASR)系统的预处理以及音频分割和过滤。

模型特点

高效实时处理
在苹果芯片(M1/M2)上每32ms音频块处理延迟小于2ms,实时因子为0.02x。
低资源占用
模型总大小约2MB,内存使用约15MB,CPU使用率低于5%(单核)。
高准确率
在常见语音数据集上精确率达94.2%,召回率达92.8%,F1分数达93.5%。
苹果平台优化
专为iOS/macOS平台优化,包含预转换的CoreML模型,可直接用于Swift应用程序。

模型能力

实时语音活动检测
音频预处理
音频分割
音频过滤

使用案例

语音处理
实时语音活动检测
在iOS/macOS应用程序中实时检测语音活动。
高准确率检测语音活动,延迟低。
自动语音识别(ASR)预处理
为ASR系统进行语音预处理,提高识别效率。
优化ASR系统的输入质量。
音频分割和过滤
对音频进行分割和过滤,提取有效语音部分。
提高音频处理的效率和准确性。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase