ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v5開源模型

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5

由gary109開發

基於wav2vec2-large-xlsr-53的自動語音識別模型，在GARY109/AI_LIGHT_DANCE數據集上微調

下載量 160

發布時間 : 6/27/2022

模型概述

該模型是用於自動語音識別(ASR)任務的微調版本，專門針對AI_LIGHT_DANCE數據集優化，能夠將語音轉換為文本

高性能語音識別

在評估集上取得了0.6622的詞錯誤率(WER)

基於wav2vec2架構

採用強大的wav2vec2-large-xlsr-53作為基礎模型

領域優化

在AI_LIGHT_DANCE數據集上進行了專門微調

語音轉文本

自動語音識別

遊戲音頻處理

舞蹈遊戲語音指令識別

識別舞蹈遊戲中的語音指令

詞錯誤率0.6622

訓練損失	輪數	步數	驗證損失	字錯率（Wer）
0.8867	1.0	376	1.0382	0.6821
0.8861	2.0	752	1.0260	0.6686
0.8682	3.0	1128	1.0358	0.6604
0.8662	4.0	1504	1.0234	0.6665
0.8463	5.0	1880	1.0333	0.6666
0.8573	6.0	2256	1.0163	0.6622
0.8628	7.0	2632	1.0209	0.6551
0.8493	8.0	3008	1.0525	0.6582
0.8371	9.0	3384	1.0409	0.6515
0.8229	10.0	3760	1.0597	0.6523