H

Humaware VAD

由CuriousMonkey7開發
基於Silero-VAD微調的哼唱感知語音活動檢測模型,專門用於區分哼唱與真實語音
下載量 434
發布時間 : 3/6/2025

模型概述

HumAware-VAD通過使用自定義數據集微調Silero-VAD模型,提升在哼唱存在時的語音檢測準確率,減少哼唱被誤判為語音的情況。

模型特點

哼唱感知
專門針對哼唱與真實語音的區分進行優化,減少假陽性
即時推理
保持Silero-VAD的即時推理能力
抗噪聲優化
在混合音頻中更準確地分割語音,提升抗噪聲能力

模型能力

語音活動檢測
哼唱識別
音頻分割

使用案例

語音處理
自動語音識別預處理
在ASR系統中更準確地分割語音片段
減少哼唱導致的誤識別
語音通信過濾
在通話或語音通信中過濾非語音內容
提高通話質量
音頻分析
音樂與人聲分離
在混合音頻中區分人聲與背景音樂
更準確的音頻成分分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase