W

Wav2vec2 Xls R 300m English

Developed by vitouphy
XLS-R-300M是基於facebook/wav2vec2-xls-r-300m在librispeech_asr數據集上微調的英語自動語音識別模型,在LibriSpeech測試集上取得了12.29%的詞錯誤率。
Downloads 21
Release Time : 3/2/2022

Model Overview

該模型是一個英語自動語音識別(ASR)模型,專門針對英語語音到文本轉換任務進行了優化。

Model Features

多數據集表現優異
在LibriSpeech、Common Voice和魯棒語音事件等多個數據集上進行了評估,表現穩定。
高效訓練
採用梯度累積和混合精度訓練等技術,提高了訓練效率。
低詞錯誤率
在LibriSpeech乾淨測試集上達到12.29%的詞錯誤率,表現優秀。

Model Capabilities

英語語音識別
語音轉文本
長音頻處理

Use Cases

語音轉錄
音頻書籍轉錄
將有聲讀物內容轉錄為文本
在LibriSpeech測試集上詞錯誤率12.29%
語音助手
語音命令識別
識別和理解用戶語音命令
在魯棒語音事件測試集上詞錯誤率38.8%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase