W

Wav2vec2 Xls R 1b English

由jonatasgrosman開發
這是一個基於XLS-R 1B架構的英語語音識別模型,在多個英語語音數據集上進行了微調。
下載量 1,896
發布時間 : 3/2/2022

模型概述

該模型針對英語語音識別任務進行了優化,能夠將英語語音轉換為文本。

模型特點

多數據集訓練
使用Common Voice 8.0、Multilingual LibriSpeech、TED-LIUMv3和Voxpopuli等多個數據集進行訓練
高性能
在Common Voice 8測試集上達到21.05%的WER和8.44%的CER
支持語言模型
可以結合語言模型(LM)使用,進一步提升識別準確率

模型能力

英語語音識別
即時語音轉文本
支持16kHz採樣率音頻處理

使用案例

語音轉錄
會議記錄
將英語會議錄音自動轉換為文字記錄
準確率約80% (WER 20%)
播客轉錄
將英語播客內容轉換為文字稿
輔助技術
語音輸入系統
為殘障人士提供語音輸入解決方案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase