wav2vec-fine_tuned-speech_command2開源語音識別模型 - 準確率97.35%，精準識別語音

Wav2vec Fine Tuned Speech Command2

由Thamer開發

基於facebook/wav2vec2-base在speech_commands數據集上微調的語音識別模型，準確率達97.35%

下載量 16

發布時間 : 8/13/2023

模型概述

該模型是wav2vec2-base的微調版本，專門用於語音命令識別任務，在評估集上表現出色。

高準確率

在speech_commands評估集上達到97.35%的準確率

基於wav2vec2架構

採用facebook的wav2vec2-base作為基礎模型，具有強大的語音特徵提取能力

高效微調

僅需10輪訓練即可達到高性能

語音命令識別

短語音分類

智能家居控制

語音控制設備

識別用戶發出的語音命令來控制智能家居設備

高準確率識別常見控制命令

語音交互應用

語音助手命令識別

識別用戶對語音助手發出的基本指令