A

Asr Wav2vec2 Dvoice Darija

由speechbrain開發
這是一個針對摩洛哥阿拉伯語方言(Darija)的自動語音識別模型,基於wav2vec 2.0架構在DVoice數據集上微調訓練而成。
下載量 120
發布時間 : 6/9/2022

模型概述

該模型提供端到端的Darija語音轉錄功能,採用預訓練的wav2vec 2.0模型作為基礎,疊加DNN層並在Darija數據集上微調,最終通過CTC貪婪解碼器輸出文本結果。

模型特點

低資源語言支持
專門針對資源稀缺的Darija方言優化,通過遷移學習技術解決數據不足問題
社區驅動數據
基於DVoice平臺收集的真實社區錄音數據訓練,反映實際語言使用場景
高效微調架構
在預訓練的wav2vec2-large-xlsr-53模型基礎上,僅添加兩層DNN進行微調,實現高效訓練

模型能力

摩洛哥阿拉伯語方言語音識別
16kHz單聲道音頻處理
自動音頻標準化(重採樣/單聲道選擇)

使用案例

語音轉錄
方言媒體內容轉錄
將摩洛哥方言的播客、視頻等內容自動轉為文字
測試集WER 18.28%,CER 5.85%
語音助手
方言語音指令識別
為摩洛哥地區用戶提供方言交互的語音助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase