W

Wav2vec2 Large Xlsr 53 Russian

Developed by jonatasgrosman
基於facebook/wav2vec2-large-xlsr-53模型微調的俄語語音識別模型,支持16kHz採樣率的語音輸入
Downloads 3.9M
Release Time : 3/2/2022

Model Overview

該模型是針對俄語優化的自動語音識別(ASR)模型,基於XLSR-53架構微調,在Common Voice俄語數據集上表現出色

Model Features

高性能俄語識別
在Common Voice俄語測試集上達到13.3%的詞錯誤率和2.88%的字符錯誤率
支持語言模型增強
結合語言模型後,詞錯誤率可降至9.57%,字符錯誤率降至2.24%
多數據集訓練
使用Common Voice 6.1和CSS10數據集進行訓練和驗證
16kHz採樣率支持
專為16kHz採樣率的語音輸入優化

Model Capabilities

俄語語音轉文本
長音頻處理(支持分塊處理)
即時語音識別

Use Cases

語音轉錄
俄語語音轉寫
將俄語語音內容轉換為文本
在Common Voice測試集上達到13.3%的詞錯誤率
語音助手
俄語語音指令識別
識別俄語語音命令
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase