HumAware-VADオープンソースモデル - ハミングと実際の音声を正確に区別する音声活動検出ツール

ホーム

Humaware VAD

CuriousMonkey7によって開発

Silero-VADをファインチューニングしたハミング感知音声活動検出モデルで、ハミングと実際の音声を区別するために特別に設計されています

音声認識英語オープンソースライセンス:MIT #ハミング認識最適化 #混合音声VAD #リアルタイム音声分割

ダウンロード数 434

リリース時間 : 3/6/2025

モデル概要

HumAware-VADは、カスタムデータセットを使用してSilero-VADモデルをファインチューニングすることで、ハミングが存在する場合の音声検出精度を向上させ、ハミングが音声として誤判定されるケースを減らします。

モデル特徴

ハミング感知

ハミングと実際の音声の区別に特化して最適化され、偽陽性を減少させます

リアルタイム推論

Silero-VADのリアルタイム推論能力を維持

ノイズ耐性最適化

混合音声において音声をより正確に分割し、ノイズ耐性を向上させます

モデル能力

音声活動検出

ハミング認識

音声分割

使用事例

音声処理

自動音声認識前処理

ASRシステムにおいて音声セグメントをより正確に分割

ハミングによる誤認識を減少

音声通信フィルタリング

通話や音声通信において非音声コンテンツをフィルタリング

通話品質の向上

音声分析

音楽とボーカル分離

混合音声においてボーカルと背景音楽を区別

より正確な音声成分分析

🚀 [WIP]HumAware-VAD: ハミングを考慮した音声活性検出

HumAware-VADは、Silero-VAD モデルをファインチューニングしたもので、ハミングと実際の音声を区別するように訓練されています。標準的な音声活性検出（VAD）モデル、Silero-VADを含め、しばしばハミングを音声と誤分類し、不正確な音声セグメンテーションにつながります。HumAware-VADは、カスタムデータセット（HumSpeechBlend）を利用することで、ハミングが存在する場合の音声検出精度を向上させます。

🚀 クイックスタート

🔹 依存関係のインストール

pip install torch torchaudio

🔹 モデルの読み込み

import torch

def load_humaware_vad(model_path="humaware_vad.jit"):
    model = torch.jit.load(model_path)
    model.eval()
    return model

vad_model = load_humaware_vad()

🔹 推論の実行

import torchaudio

waveform, sample_rate = torchaudio.load("data/0000.wav")
out = vad_model(waveform)
print("VAD Output:", out)

✨ 主な機能

誤検出の削減：ハミングが誤って音声として検出される誤検出を減らします。
音声セグメンテーション精度の向上：実世界のアプリケーションにおける音声セグメンテーション精度を高めます。
複雑な環境での性能向上：音楽、背景雑音、ボーカル音を含むタスクでのVAD性能を改善します。

📚 ドキュメント

📌 概要

🎯 目的

HumAware-VADの主な目的は以下の通りです。

ハミングが誤って音声として検出される誤検出を減らす。
実世界のアプリケーションにおける音声セグメンテーション精度を高める。
音楽、背景雑音、ボーカル音を含むタスクでのVAD性能を改善する。

🗂️ モデルの詳細

属性	詳情
ベースモデル	Silero-VAD
ファインチューニングデータセット	HumSpeechBlend
形式	JIT (TorchScript)
フレームワーク	PyTorch
推論速度	リアルタイム

📄 ライセンス

このモデルはMITライセンスの下で提供されています。

📄 引用

このモデルを使用する場合は、以下のように引用してください。

@model{HumAwareVAD2025,
  author = {Sourabh Saini},
  title = {HumAware-VAD: Humming-Aware Voice Activity Detection},
  year = {2025},
  publisher = {Hugging Face},
  url = {https://huggingface.co/CuriousMonkey7/HumAware-VAD}
}