ai-light-dance_singing_ft_wav2vec2-large-lv60開源模型

Ai Light Dance Singing Ft Wav2vec2 Large Lv60

由gary109開發

該模型是基於facebook/wav2vec2-large-lv60在AI_LIGHT_DANCE.PY - ONSET-SINGING數據集上微調的自動語音識別模型

下載量 16

發布時間 : 5/15/2022

模型概述

一個用於語音識別任務的微調模型，特別針對歌唱內容進行了優化

歌唱內容識別優化

針對歌唱內容進行了專門微調，可能比通用語音識別模型在歌唱內容上表現更好

低詞錯誤率

在評估集上取得了0.2088的詞錯誤率(WER)，表現良好

基於wav2vec2架構

採用facebook的wav2vec2-large-lv60作為基礎模型，具有強大的語音特徵提取能力

語音識別

歌唱內容識別

音樂相關應用

歌唱內容轉錄

將歌唱音頻轉換為文字

詞錯誤率0.2088

音樂教育輔助

幫助音樂學習者分析歌唱內容

訓練損失	輪數	步數	驗證損失	字錯率（Wer）
0.7432	1.0	4422	0.8939	0.6323
0.5484	2.0	8844	0.6393	0.3557
0.3919	3.0	13266	0.5315	0.2833
0.421	4.0	17688	0.5234	0.2522
0.3957	5.0	22110	0.5125	0.2247
0.3228	6.0	26532	0.4542	0.2088
0.346	7.0	30954	0.4673	0.1997
0.1637	8.0	35376	0.4583	0.1910
0.1508	9.0	39798	0.4623	0.1837
0.1564	10.0	44220	0.4717	0.1835

屬性	詳情
模型類型	基於 facebook/wav2vec2-large-lv60 在 AI_LIGHT_DANCE.PY - ONSET - SINGING 數據集上微調的模型
訓練數據	ai_light_dance 數據集
標籤	自動語音識別、AI_Light_Dance.py、由訓練器生成