internal.wav2vec2-base-superb-ks-int8-structured79開源模型

Internal.wav2vec2 Base Superb Ks Int8 Structured79

由yujiepan開發

該模型是基於wav2vec2-base-ft-keyword-spotting在superb數據集上微調的版本，用於音頻分類任務，經過量化和結構化剪枝優化。

下載量 16

發布時間 : 3/14/2023

模型概述

這是一個經過微調和優化的音頻分類模型，基於wav2vec2架構，在關鍵詞識別任務上表現出色。

高準確率

在評估集上取得了98.15%的準確率

優化處理

經過量化和結構化剪枝（Transformer塊線性層的稀疏度為80）

高效訓練

使用混合精度訓練和梯度累積等技術優化訓練過程

音頻分類

關鍵詞識別

語音交互

語音指令識別

識別設備控制指令中的關鍵詞

高準確率識別

音頻分析

音頻內容分類

對音頻片段進行分類