A

Asr Wav2vec2 Dvoice Wolof

由speechbrain開發
這是一個針對沃洛夫語的自動語音識別模型,基於wav2vec 2.0架構,在DVoice數據集上訓練,支持沃洛夫語語音轉錄。
下載量 44
發布時間 : 6/9/2022

模型概述

該模型是一個端到端的自動語音識別系統,結合了預訓練的wav2vec 2.0模型和CTC/Attention機制,專門用於沃洛夫語的語音識別任務。

模型特點

預訓練模型微調
基於facebook/wav2vec2-large-xlsr-53預訓練模型進行微調,充分利用大規模預訓練的優勢
端到端解決方案
提供從音頻輸入到文本輸出的完整流程,包括音頻預處理和轉錄
低資源語言支持
專門針對沃洛夫語這類低資源語言優化,有助於促進非洲語言技術的發展

模型能力

沃洛夫語語音識別
音頻文件轉錄
即時語音轉文本

使用案例

語音轉錄
沃洛夫語語音轉錄
將沃洛夫語語音內容轉換為文本
驗證集CER 4.81%,WER 16.25%
語言技術開發
非洲語言技術研究
為非洲低資源語言提供語音技術研究基礎
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase