W

Wav2vec2 Base Toy Train Data Random Noise

由scasutt開發
該模型是基於facebook/wav2vec2-base在玩具訓練數據上微調的語音識別模型,主要用於處理隨機噪聲環境下的語音識別任務。
下載量 22
發布時間 : 3/27/2022

模型概述

這是一個經過微調的wav2vec2-base模型,專門用於在隨機噪聲環境下進行語音識別。模型在評估集上取得了0.7351的詞錯誤率。

模型特點

噪聲環境適應
針對隨機噪聲環境進行了優化,提高了在嘈雜條件下的語音識別準確率
基於wav2vec2架構
建立在強大的wav2vec2-base模型基礎上,繼承了其優秀的語音特徵提取能力

模型能力

語音識別
噪聲環境下的語音處理

使用案例

語音轉錄
嘈雜環境下的語音轉錄
將包含隨機噪聲的語音轉換為文字
詞錯誤率0.7351
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase