S

Stt Be Fastconformer Hybrid Large Pc

由nvidia開發
這是一個基於FastConformer架構的大型白俄羅斯語自動語音識別模型,結合了轉換器和CTC解碼器損失,在1500小時白俄羅斯語音數據上訓練。
下載量 33
發布時間 : 5/19/2023

模型概述

該模型用於轉錄包含大小寫白俄羅斯字母、空格和基本標點符號的語音,支持16kHz單聲道音頻輸入。

模型特點

混合訓練架構
同時使用轉換器和CTC解碼器損失進行訓練,結合兩種方法的優勢
高效處理
採用8倍深度可分離卷積下采樣的FastConformer架構,優化處理速度
高準確率
在Common Voice 12.0白俄羅斯語測試集上達到2.72%的WER(不含標點)

模型能力

白俄羅斯語語音識別
音頻轉錄
標點符號預測

使用案例

語音轉錄
語音轉文字
將白俄羅斯語語音內容轉換為文本
準確率高達97.28%(不含標點)
語音助手
語音指令識別
用於白俄羅斯語語音助手系統中的命令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase