A

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 2

由gary109開發
基於wav2vec2-large-xlsr-53模型微調的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上訓練
下載量 68
發布時間 : 6/29/2022

模型概述

該模型是用於語音識別任務的微調版本,特別針對歌唱語音進行了優化

模型特點

歌唱語音識別優化
專門針對歌唱語音進行了微調,可能對音樂相關語音識別有更好表現
基於wav2vec2架構
採用先進的wav2vec2-large-xlsr-53架構,具有良好的語音識別基礎
低詞錯誤率
在評估集上取得了9.1%的詞錯誤率,表現良好

模型能力

語音轉文本
歌唱語音識別

使用案例

音樂應用
歌詞轉錄
將歌唱錄音自動轉換為歌詞文本
詞錯誤率約9.1%
語音識別
語音轉寫
將語音內容轉換為文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase