W

Wav2vec2 Large Xls R 300m Hsb V1

由DrishtiSharma開發
這是一個基於facebook/wav2vec2-xls-r-300m在上索布語(HSB)數據集上微調的自動語音識別模型,在Common Voice 8測試集上取得了0.4393的詞錯誤率(WER)。
下載量 20
發布時間 : 3/2/2022

模型概述

該模型專門用於上索布語的自動語音識別任務,基於wav2vec2架構,在Mozilla Common Voice 8數據集上訓練。

模型特點

低資源語言支持
專門為上索布語這種低資源語言優化的語音識別模型
基於XLS-R架構
使用Facebook的wav2vec2-XLS-R-300M作為基礎模型,具有強大的跨語言表示能力
在Common Voice上微調
在Mozilla Common Voice 8的上索布語數據集上進行微調,適應特定語言特徵

模型能力

上索布語語音識別
語音轉文本

使用案例

語音轉錄
上索布語語音轉錄
將上索布語的語音內容轉換為文本
在Common Voice測試集上WER為0.4393
語言保護
少數民族語言數字化
幫助保存和數字化上索布語等少數民族語言
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase