X

Xls R Kyrgiz Cv8

由lucio開發
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice 8.0吉爾吉斯語數據集上微調的自動語音識別模型
下載量 16
發布時間 : 3/2/2022

模型概述

針對吉爾吉斯語優化的語音識別模型,適用於從語音到文本的轉換任務

模型特點

低詞錯誤率
在測試集上達到19.01%的WER(帶語言模型)
多場景適用
針對低保真度語音場景優化,適用於多種實際應用
漸進式學習
採用漸進式學習率調度策略,優化訓練效果

模型能力

吉爾吉斯語語音識別
語音轉文本
音頻內容索引

使用案例

媒體處理
視頻字幕生成
為吉爾吉斯語視頻內容自動生成字幕草稿
WER 19.01%(帶語言模型)
廣播內容索引
對錄製的吉爾吉斯語廣播節目進行內容索引
CER 5.38%(帶語言模型)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase