W

Wav2vec2 Base Ft Keyword Spotting Int8

由dkurt開發
基於wav2vec2架構的語音關鍵詞檢測模型,經過OpenVINO量化優化
下載量 14
發布時間 : 3/2/2022

模型概述

該模型是基於wav2vec2架構的語音處理模型,專門用於關鍵詞檢測任務。經過Optimum OpenVINO量化處理後,模型在保持較高準確率的同時提升了推理效率。

模型特點

高效量化
通過Optimum OpenVINO進行量化處理,在準確率僅下降2.74%的情況下顯著提升推理效率
高準確率
在評估集上達到0.9828的基準準確率,量化後仍保持0.9553的高準確率
輕量級
基於wav2vec2-base架構,相對輕量且適合邊緣設備部署(推斷)

模型能力

語音關鍵詞識別
即時音頻處理
邊緣設備部署

使用案例

智能家居
語音喚醒詞檢測
用於檢測設備喚醒詞如'Hey Siri'、'OK Google'等
高準確率確保設備能可靠響應
工業應用
語音控制指令識別
在嘈雜工業環境中識別特定語音指令
量化後模型適合部署在邊緣設備
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase