W

Wav2vec2 Base Ft Keyword Spotting

由anton-l開發
基於facebook/wav2vec2-base在SUPERB數據集上微調的語音關鍵詞識別模型,準確率達98.26%
下載量 70
發布時間 : 3/2/2022

模型概述

該模型是用於關鍵詞識別的語音分類模型,基於wav2vec2架構微調,擅長從語音中檢測特定關鍵詞

模型特點

高準確率
在評估集上達到98.26%的準確率,表現優異
基於wav2vec2架構
採用經過驗證的wav2vec2-base架構作為基礎模型
高效微調
在SUPERB數據集上進行針對性微調,優化關鍵詞識別能力

模型能力

語音分類
關鍵詞識別
音頻特徵提取

使用案例

智能家居
語音喚醒
用於智能設備的語音喚醒功能
高準確率識別喚醒詞
語音助手
命令詞識別
識別用戶語音指令中的關鍵命令詞
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase