W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian

由Edresson開發
基於Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0、M-AILABS數據集及數據增強技術在俄語上進行微調的語音識別模型。
下載量 23
發布時間 : 3/2/2022

模型概述

該模型是一個自動語音識別(ASR)系統,專門針對俄語優化,能夠將俄語語音轉換為文本。

模型特點

多數據集微調
使用Common Voice 7.0和M-AILABS數據集進行訓練,提高了模型識別準確性
數據增強技術
採用基於TTS和語音轉換的數據增強方法,增強了模型的泛化能力
俄語優化
專門針對俄語語音特點進行優化,在俄語識別任務上表現優異

模型能力

俄語語音識別
語音轉文本
自動語音識別

使用案例

語音轉錄
俄語語音轉寫
將俄語語音內容自動轉換為文本
在Common Voice 7.0測試集上達到19.46%的詞錯誤率
語音助手
俄語語音指令識別
用於俄語語音助手中的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase