W

Wav2vec2 Xls R 300m Korean Lm

由w11wo開發
基於XLS-R架構的韓語自動語音識別模型,在Zeroth韓語數據集上微調並添加5-gram語言模型
下載量 23
發布時間 : 3/2/2022

模型概述

該模型是用於韓語自動語音識別(ASR)的深度學習模型,基於Facebook的Wav2Vec2-XLS-R-300M架構微調,適用於韓語語音轉文本任務。

模型特點

韓語優化
專門針對韓語語音識別進行微調,在Zeroth韓語數據集上表現良好
5-gram語言模型增強
添加了基於Open Subtitles韓語子集訓練的5-gram語言模型,提升識別準確率
魯棒性測試
參與了HuggingFace組織的魯棒語音挑戰賽,在多種條件下測試性能

模型能力

韓語語音識別
語音轉文本
支持5-gram語言模型解碼

使用案例

語音轉錄
韓語語音轉錄
將韓語語音內容轉換為文本
在Zeroth韓語數據集上達到30.94% WER和7.97% CER
語音助手
韓語語音命令識別
識別和理解韓語語音命令
在魯棒語音事件測試數據上達到66.47% WER
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase