S

Stt Ru Fastconformer Hybrid Large Pc

由nvidia開發
這是一個用於俄語自動語音識別的FastConformer混合模型,結合了Transducer和CTC解碼器,參數規模約1.15億。
下載量 6,513
發布時間 : 5/26/2023

模型概述

該模型能夠轉錄包含大小寫俄語字母、空格和基本標點符號的語音,適用於俄語語音識別任務。

模型特點

混合訓練架構
同時使用Transducer和CTC兩種損失函數進行訓練,提高模型魯棒性
優化的FastConformer
採用8倍深度可分離卷積下采樣的優化Conformer架構,提高處理效率
多數據集訓練
在包含1840小時俄語語音的複合數據集上訓練,覆蓋多種語音場景

模型能力

俄語語音識別
標點符號預測
大小寫識別

使用案例

語音轉錄
俄語語音轉文本
將俄語語音內容轉換為文本格式
在Common Voice 12.0測試集上WER為5.3
語音助手
俄語語音指令識別
識別和理解俄語語音命令
在Golos crowd測試集上WER低至1.9
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase