W

Wav2vec2 Large Xls R 300m Urdu

由omar47開發
該模型是基於facebook/wav2vec2-xls-r-300m微調的版本,專門針對烏爾都語語音識別任務進行了優化。
下載量 27
發布時間 : 4/29/2022

模型概述

這是一個用於烏爾都語語音識別的自動語音識別(ASR)模型,基於wav2vec2-xls-r-300m架構微調,在評估集上取得了17.02%的詞錯誤率(WER)。

模型特點

烏爾都語優化
專門針對烏爾都語語音特徵進行微調,提高了識別準確率
低詞錯誤率
在評估集上取得了17.02%的詞錯誤率(WER)
基於大模型微調
基於facebook/wav2vec2-xls-r-300m大模型進行微調,繼承了其強大的語音特徵提取能力

模型能力

烏爾都語語音識別
音頻轉文本
語音轉錄

使用案例

語音轉錄
烏爾都語會議記錄
將烏爾都語會議錄音自動轉錄為文字記錄
約83%的準確率
語音助手
用於烏爾都語語音助手應用的語音識別組件
教育
語言學習應用
幫助學習者練習烏爾都語發音並提供反饋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase