W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian

由Edresson開發
這是一個基於Facebook的wav2vec2-large-100k-voxpopuli模型,使用Common Voice 7.0和M-AILABS俄語數據進行微調的語音識別模型。
下載量 25
發布時間 : 3/2/2022

模型概述

該模型主要用於俄語語音識別任務,能夠將俄語語音轉換為文本。

模型特點

高精度俄語語音識別
在Common Voice 7.0俄語測試集上達到24.80%的詞錯誤率(WER)。
多數據源訓練
結合了Common Voice和M-AILABS兩個高質量的俄語語音數據集進行微調。
基於Transformer架構
採用先進的wav2vec2架構,具有強大的語音特徵提取能力。

模型能力

俄語語音識別
語音轉文本
音頻處理

使用案例

語音轉錄
俄語語音轉寫
將俄語語音內容轉換為文本格式
詞錯誤率24.80%
語音助手
俄語語音指令識別
用於俄語語音助手或智能家居設備的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase