W

Wav2vec2 Xlsr 1b Ru

由RASMUS開發
基於facebook/wav2vec2-xls-r-1b在Common Voice數據集上微調的俄語自動語音識別模型
下載量 41
發布時間 : 3/2/2022

模型概述

該模型是針對俄語優化的自動語音識別(ASR)模型,基於10億參數的XLS-R架構,在Common Voice 8俄語數據集上微調,能夠將俄語語音轉換為文本。

模型特點

大規模預訓練架構
基於10億參數的XLS-R架構,具備強大的語音特徵提取能力
俄語優化
專門針對俄語語音特點進行微調,適應俄語發音和語法特徵
多數據集驗證
在Common Voice和魯棒語音事件等多個數據集上驗證性能

模型能力

俄語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
俄語語音轉文字
將俄語語音內容轉換為可編輯的文本格式
在Common Voice測試集上WER為10.83%
語音助手
俄語語音指令識別
用於俄語語音助手和智能家居設備的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase