W

Wav2vec2 Large Xls R 300m Cantonese

由ivanlau開發
這是一個基於facebook/wav2vec2-xls-r-300m模型在粵語(香港)數據集上微調的自動語音識別(ASR)模型,專門用於處理粵語語音識別任務。
下載量 42
發布時間 : 3/2/2022

模型概述

該模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - ZH-HK數據集上對facebook/wav2vec2-xls-r-300m進行微調的版本,主要用於粵語(香港)的語音識別任務。

模型特點

粵語語音識別
專門針對香港粵語優化的語音識別能力
基於XLS-R架構
使用facebook的wav2vec2-xls-r-300m模型作為基礎,具備強大的語音特徵提取能力
多數據集評估
在Common Voice 8和魯棒語音事件等多個數據集上進行評估

模型能力

粵語語音轉文本
自動語音識別
語音內容轉錄

使用案例

語音轉錄
粵語語音內容轉錄
將粵語語音內容轉換為文本
在Common Voice 8測試集上WER為0.8111,CER為0.2196
語音助手
粵語語音指令識別
識別和理解粵語語音指令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase