A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5

由gary109開發
基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上微調
下載量 160
發布時間 : 6/27/2022

模型概述

該模型是用於自動語音識別(ASR)任務的微調版本,專門針對AI_LIGHT_DANCE數據集優化,能夠將語音轉換為文本

模型特點

高性能語音識別
在評估集上取得了0.6622的詞錯誤率(WER)
基於wav2vec2架構
採用強大的wav2vec2-large-xlsr-53作為基礎模型
領域優化
在AI_LIGHT_DANCE數據集上進行了專門微調

模型能力

語音轉文本
自動語音識別

使用案例

遊戲音頻處理
舞蹈遊戲語音指令識別
識別舞蹈遊戲中的語音指令
詞錯誤率0.6622
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase