W

Wav2vec2 Xlsr Tatar

由sammy786開發
該模型是基於facebook/wav2vec2-xls-r-1b在韃靼語數據集上微調得到的自動語音識別模型,在Common Voice 8數據集上取得了16.87%的詞錯誤率(WER)。
下載量 17
發布時間 : 3/2/2022

模型概述

用於韃靼語自動語音識別的預訓練模型,基於wav2vec2-xls-r-1b架構微調

模型特點

低詞錯誤率
在韃靼語測試集上達到16.87%的詞錯誤率(WER)和3.64%的字錯誤率(CER)
基於大規模預訓練模型
基於facebook/wav2vec2-xls-r-1b模型微調,繼承了其強大的語音特徵提取能力
韃靼語優化
專門針對韃靼語語音數據進行優化,適用於韃靼語語音識別場景

模型能力

韃靼語語音識別
語音轉文本
連續語音識別

使用案例

語音轉錄
韃靼語語音轉寫
將韃靼語語音內容轉換為文本
詞錯誤率16.87%,字錯誤率3.64%
語音助手
韃靼語語音交互
為韃靼語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase