W

Wav2vec2 Base Superb Ks

由superb開發
基於wav2vec2-base的SUPERB關鍵詞檢測模型,專為16kHz語音設計
下載量 5,820
發布時間 : 3/2/2022

模型概述

該模型移植自S3PRL,用於關鍵詞檢測任務,能夠將語音分類到預定義詞表中識別註冊關鍵詞。

模型特點

高準確率
在Speech Commands v1.0測試集上達到96.43%的準確率
設備端友好
專為兼顧準確率、模型體積和推理速度的設備端運行設計
標準化處理
採用16kHz統一採樣率,確保輸入語音的標準化處理

模型能力

語音分類
關鍵詞識別
靜音檢測
未知詞檢測

使用案例

智能設備控制
語音助手喚醒詞檢測
用於檢測設備喚醒詞如'Hey Siri'或'OK Google'
高準確率識別減少誤觸發
無障礙技術
語音控制界面
為行動不便用戶提供語音控制命令識別
實現高效準確的命令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase