G

Google Speech Command Xvector

由speechbrain開發
使用SpeechBrain訓練的語音指令識別模型,基於谷歌語音指令數據集,可識別12個關鍵詞。
下載量 67
發布時間 : 3/2/2022

模型概述

該系統由TDNN模型結合統計池化構成,頂部應用了分類器,用於在短音頻片段中檢測單個關鍵詞。

模型特點

高準確率
在測試集上達到98.14%的準確率
輕量級
適用於嵌入式設備和即時應用
多指令支持
可識別12種不同的語音指令

模型能力

語音指令識別
關鍵詞檢測
短音頻分類

使用案例

智能家居控制
語音控制設備
通過語音指令控制智能家居設備
識別'開'、'關'等指令
車載系統
車載語音控制
通過語音指令控制車載系統
識別'前進'、'停'等指令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase