W

Wav2vec2 Xls R 300m English

由vitouphy開發
XLS-R-300M是基於facebook/wav2vec2-xls-r-300m在librispeech_asr數據集上微調的英語自動語音識別模型,在LibriSpeech測試集上取得了12.29%的詞錯誤率。
下載量 21
發布時間 : 3/2/2022

模型概述

該模型是一個英語自動語音識別(ASR)模型,專門針對英語語音到文本轉換任務進行了優化。

模型特點

多數據集表現優異
在LibriSpeech、Common Voice和魯棒語音事件等多個數據集上進行了評估,表現穩定。
高效訓練
採用梯度累積和混合精度訓練等技術,提高了訓練效率。
低詞錯誤率
在LibriSpeech乾淨測試集上達到12.29%的詞錯誤率,表現優秀。

模型能力

英語語音識別
語音轉文本
長音頻處理

使用案例

語音轉錄
音頻書籍轉錄
將有聲讀物內容轉錄為文本
在LibriSpeech測試集上詞錯誤率12.29%
語音助手
語音命令識別
識別和理解用戶語音命令
在魯棒語音事件測試集上詞錯誤率38.8%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase