X

Xls R Uyghur Cv8

由lucio開發
基於facebook/wav2vec2-xls-r-300m在Common Voice 8維吾爾語數據集上微調的自動語音識別模型
下載量 24
發布時間 : 3/2/2022

模型概述

該模型是針對維吾爾語優化的自動語音識別(ASR)模型,適用於低精度要求的語音轉文字場景

模型特點

維吾爾語優化
專門針對維吾爾語波斯-阿拉伯字母表優化,移除了標點符號
漸進式學習策略
採用2000步預熱和9400步冷卻的學習率策略,優化訓練效果
低資源適應
在有限數據條件下仍能取得較好識別效果

模型能力

維吾爾語語音識別
廣播錄音轉文字
視頻字幕生成

使用案例

媒體處理
視頻字幕草稿生成
為維吾爾語視頻內容自動生成初步字幕
詞錯誤率30.5%,字符錯誤率5.8%
廣播錄音索引
將維吾爾語廣播內容轉換為可搜索文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase