S

Stt Kk Ru Fastconformer Hybrid Large

由nvidia開發
NVIDIA FastConformer-Hybrid Large (kk-ru) 是一個語音識別模型,可將哈薩克語和俄語語音轉錄為小寫文本。
下載量 930
發布時間 : 9/10/2024

模型概述

該模型基於FastConformer Transducer - CTC架構,是混合模型,結合了Token - and - Duration Transducer和CTC兩種損失函數進行訓練,適用於哈薩克語和俄語的語音識別任務。

模型特點

多語言支持
支持哈薩克語和俄語的語音識別。
混合模型架構
結合了Token - and - Duration Transducer和CTC兩種損失函數進行訓練,提升模型性能。
高性能
在多個測試集上表現出色,字錯誤率(WER)較低。

模型能力

語音識別
多語言轉錄
非流式語音處理

使用案例

語音轉錄
哈薩克語語音轉錄
將哈薩克語語音轉錄為文本。
在KSC2測試集(朗讀)上的WER為4.43%。
俄語語音轉錄
將俄語語音轉錄為文本。
在MCV12測試集上的WER為6.29%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase