W

Wav2vec2 Large Ru Golos With Lm

由bond005開發
這是一個基於facebook/wav2vec2-large-xlsr-53微調的俄語語音識別模型,使用Sberdevices Golos數據集訓練,並集成了2-gram語言模型以提高識別準確率。
下載量 434
發布時間 : 9/26/2022

模型概述

該模型專門用於俄語語音識別任務,支持16kHz採樣率的音頻輸入,在多個俄語測試集上表現出色。

模型特點

集成語言模型
集成了基於俄語文本語料庫構建的2-gram語言模型,顯著提高了識別準確率
數據增強訓練
訓練時應用了音高變換、聲音加速/減速、混響等音頻增強技術,提高了模型魯棒性
多數據集評估
在Sberdevices Golos、Common Voice俄語等多個測試集上進行了全面評估

模型能力

俄語語音識別
音頻轉錄
語音轉文本

使用案例

語音助手
智能家居控制
用於俄語智能家居設備的語音指令識別
在遠場測試集上CER為5.128%
語音轉錄
會議記錄轉錄
將俄語會議錄音自動轉錄為文字
在眾包測試集上WER為6.883%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase