S

Stt Ru Conformer Transducer Large

由nvidia開發
這是一個基於Conformer架構的非自迴歸大型俄語語音識別模型,參數約1.2億,訓練數據約1636小時俄語語音。
下載量 537
發布時間 : 10/24/2022

模型概述

該模型能夠將俄語語音轉錄為包含空格的小寫西裡爾字母,適用於俄語語音識別任務。

模型特點

多數據集訓練
在多個俄語語音數據集上進行訓練,包括Mozilla Common Voice 10.0、SberDevices/Golos、Russian-LibriSpeech和SOVA-Dataset等。
非自迴歸架構
採用Conformer的非自迴歸'大型'變體,約有1.2億個參數。
易於使用
可在NeMo工具包中使用,支持自動實例化模型和轉錄語音。

模型能力

俄語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
俄語語音轉錄
將俄語語音轉換為文本
準確率較高,在MCV 10.0測試集上WER為4.0%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase