S

Stt Uk Citrinet 1024 Gamma 0 25

由nvidia開發
這是一個用於烏克蘭語自動語音識別(ASR)的流式Citrinet模型,擁有1.41億參數,在69小時的烏克蘭語音數據上訓練,測試WER低至3.52%。
下載量 65
發布時間 : 7/27/2022

模型概述

該模型是流式Citrinet的非自迴歸變體,使用CTC損失/解碼,能夠轉錄包含空格和撇號的烏克蘭語小寫字母語音。

模型特點

跨語言遷移學習
該模型從預訓練的俄語Citrinet-1024模型通過跨語言遷移學習方法微調而來
高性能
在多個版本的Mozilla Common Voice測試集上WER表現優異,最低達到3.52%
流式處理
支持流式語音識別,適合即時應用場景
Riva兼容
兼容NVIDIA Riva,可用於生產級服務器部署

模型能力

烏克蘭語語音識別
即時語音轉錄
音頻文件批量處理

使用案例

語音轉錄
語音轉文字服務
將烏克蘭語語音內容轉換為文字
高準確率轉錄,WER低至3.52%
即時應用
即時字幕生成
為烏克蘭語視頻或直播生成即時字幕
流式處理能力支持低延遲應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase