W

Wav2vec2 Xls R 300m Zh HK V2

由w11wo開發
基於XLS-R架構的粵語自動語音識別模型,在Common Voice粵語數據集上微調
下載量 23
發布時間 : 3/2/2022

模型概述

這是一個針對粵語(zh-HK)優化的自動語音識別模型,基於Facebook的Wav2Vec2-XLS-R-300M架構微調而成,適用於粵語語音轉文本任務。

模型特點

粵語優化
專門針對粵語語音識別進行優化訓練
大規模預訓練
基於300M參數的XLS-R架構,具有強大的語音特徵提取能力
多數據集驗證
在Common Voice和魯棒語音賽事等多個數據集上進行評估

模型能力

粵語語音識別
語音轉文本
自動語音識別

使用案例

語音轉寫
粵語語音轉錄
將粵語語音內容轉換為文字
在Common Voice 8測試集上CER為23.02%
語音助手
粵語語音指令識別
用於粵語語音助手或智能家居設備的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase