W

Wav2vec2 Large Xls R 1B Common Voice7 Lt Ft

由reach-vb開發
基於facebook/wav2vec2-xls-r-1b在通用語音數據集上微調的語音識別模型
下載量 20
發布時間 : 3/2/2022

模型概述

該模型是wav2vec2-xls-r-1b的微調版本,專注於語音識別任務,在評估集上表現出色

模型特點

大規模預訓練模型微調
基於10億參數的wav2vec2-xls-r-1b模型進行微調,具備強大的語音特徵提取能力
低詞錯誤率
在評估集上取得了1.0的詞錯誤率(WER),表現優異
高效訓練
採用混合精度訓練和梯度累積等技術優化訓練效率

模型能力

語音轉文本
自動語音識別

使用案例

語音轉錄
語音轉文字服務
將語音內容轉換為文字記錄
高準確率的轉錄結果
輔助技術
語音控制界面
為殘障人士提供語音控制功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase