W

Wav2vec2 Base Toy Train Data Masked Audio 10ms

由scasutt開發
基於facebook/wav2vec2-base微調的語音識別模型,在10ms音頻掩碼任務上訓練
下載量 22
發布時間 : 3/26/2022

模型概述

該模型是wav2vec2-base的微調版本,專注於處理帶掩碼的音頻數據,適用於語音識別任務。

模型特點

10ms音頻掩碼處理
專門針對10ms間隔的掩碼音頻數據進行優化訓練
基於wav2vec2-base微調
在成熟的wav2vec2-base架構基礎上進行針對性優化

模型能力

語音識別
帶掩碼音頻處理

使用案例

語音處理
不完整音頻識別
識別部分被掩碼或缺失的語音內容
WER 0.7145
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase