W

Wav2vec2 Large Xlsr 53 842h Luxembourgish 4h

由Lemswasabi開發
基於842小時未標註和4小時標註盧森堡語音數據微調的自動語音識別模型
下載量 16
發布時間 : 3/2/2022

模型概述

該模型是基於wav2vec 2.0 large XLSR-53架構的盧森堡語語音識別模型,先在842小時未標註數據上預訓練,再在4小時標註數據上微調。

模型特點

跨語言語音表徵
利用XLSR-53的多語言預訓練模型作為基礎,有效處理資源匱乏的盧森堡語
高效數據利用
僅使用4小時標註數據就實現了較好的識別效果
雙階段訓練
先在大規模未標註數據上預訓練,再在小規模標註數據上微調

模型能力

盧森堡語語音識別
語音轉文本

使用案例

語音轉錄
盧森堡語媒體內容轉錄
將盧森堡語的廣播、電視節目自動轉錄為文本
詞錯誤率18.77%
語音助手
盧森堡語語音交互
為盧森堡地區開發本地化語音助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase