W

Wav2vec2 Base Finetuned Speech Commands V0.02

由0xb1開發
該模型是基於facebook/wav2vec2-base在speech_commands數據集上微調的語音命令識別模型,準確率達97.59%。
下載量 1.2M
發布時間 : 4/8/2023

模型概述

基於wav2vec2架構的語音命令識別模型,專門用於識別短語音命令。

模型特點

高準確率
在speech_commands評估集上達到97.59%的準確率
基於wav2vec2架構
利用wav2vec2強大的語音特徵提取能力
輕量級微調
在基礎模型上進行針對性微調,保持高效的同時提升特定任務性能

模型能力

語音命令識別
短語音分類
語音特徵提取

使用案例

智能家居控制
語音控制指令識別
識別開燈、關燈等簡單語音指令
準確率97.59%
語音助手
基礎命令識別
識別是/否、開始/停止等基礎交互命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase