W

Wav2vec2 Large Xlsr 53 Russian

由jonatasgrosman開發
基於facebook/wav2vec2-large-xlsr-53模型微調的俄語語音識別模型,支持16kHz採樣率的語音輸入
下載量 3.9M
發布時間 : 3/2/2022

模型概述

該模型是針對俄語優化的自動語音識別(ASR)模型,基於XLSR-53架構微調,在Common Voice俄語數據集上表現出色

模型特點

高性能俄語識別
在Common Voice俄語測試集上達到13.3%的詞錯誤率和2.88%的字符錯誤率
支持語言模型增強
結合語言模型後,詞錯誤率可降至9.57%,字符錯誤率降至2.24%
多數據集訓練
使用Common Voice 6.1和CSS10數據集進行訓練和驗證
16kHz採樣率支持
專為16kHz採樣率的語音輸入優化

模型能力

俄語語音轉文本
長音頻處理(支持分塊處理)
即時語音識別

使用案例

語音轉錄
俄語語音轉寫
將俄語語音內容轉換為文本
在Common Voice測試集上達到13.3%的詞錯誤率
語音助手
俄語語音指令識別
識別俄語語音命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase