W

Wav2vec2 Large Xls R 300m Ru

由mobedkova開發
這是一個基於Wav2Vec2 XLS-R架構的俄語自動語音識別模型,參數規模為300m,在公共語音和魯棒語音事件數據集上進行了評估。
下載量 37
發布時間 : 3/2/2022

模型概述

該模型主要用於俄語語音識別任務,能夠將俄語語音轉換為文本。

模型特點

高性能俄語語音識別
在公共語音-7.0俄語數據集上取得了27.81%的詞錯誤率和8.83%的字錯誤率。
魯棒性表現
在魯棒語音事件數據集上表現良好,開發數據和測試數據的詞錯誤率分別為44.64%和42.51%。
基於Wav2Vec2 XLS-R架構
採用先進的Wav2Vec2 XLS-R架構,具有強大的語音特徵提取能力。

模型能力

俄語語音識別
語音轉文本

使用案例

語音轉錄
俄語會議記錄
將俄語會議錄音自動轉錄為文字記錄
詞錯誤率27.81%(公共語音數據集)
俄語語音助手
用於俄語語音助手的語音識別模塊
語音分析
俄語語音內容分析
分析俄語語音內容,提取關鍵信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase