X

Xlsr English

由ashesicsis1開發
基於facebook/wav2vec2-xls-r-300m在librispeech_asr數據集上微調的英語語音識別模型
下載量 18
發布時間 : 5/29/2022

模型概述

該模型是針對英語語音識別任務優化的XLS-R架構模型,在LibriSpeech數據集上取得了較低的詞錯誤率

模型特點

低詞錯誤率
在評估集上達到0.1451的詞錯誤率,表現優異
基於XLS-R架構
採用facebook的wav2vec2-xls-r-300m預訓練模型作為基礎
精細調優
經過30輪訓練和線性學習率調度優化

模型能力

英語語音識別
音頻轉文本
大規模語音數據處理

使用案例

語音轉錄
有聲書轉錄
將英語有聲讀物自動轉換為文本
高準確率的轉錄結果
會議記錄
自動生成英語會議的文本記錄
輔助技術
聽力輔助
為聽障人士提供即時語音轉文字服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase