W

Wav2vec2 Large Xlsr 53 Spanish Ep5 944h

由carlosdanielhernandezmena開發
適用於西班牙語自動語音識別的聲學模型,基於facebook/wav2vec2-large-xlsr-53微調5個週期,使用約944小時西班牙語數據。
下載量 111
發布時間 : 12/1/2022

模型概述

該模型是專門為西班牙語語音識別設計的聲學模型,通過在大規模西班牙語數據集上微調得到,適用於多種西班牙語語音識別場景。

模型特點

多數據集訓練
使用了來自CIEMPIESS-UNAM項目和其他公共存儲庫的約944小時西班牙語數據進行訓練
低WER
在多個測試集上表現出色,如Mozilla Common Voice 10.0測試集WER為9.20%
方言覆蓋
訓練數據包含多種西班牙語方言,如墨西哥、智利、哥倫比亞、秘魯、阿根廷和波多黎各等地的西班牙語

模型能力

西班牙語語音識別
多種方言識別
高精度轉錄

使用案例

語音轉錄
廣播新聞轉錄
用於轉錄西班牙語廣播新聞內容
在HUB4NE測試集上WER為7.48%
電話語音轉錄
用於轉錄電話對話內容
在CALLHOME測試集上WER為39.12%
語音助手
西班牙語語音指令識別
用於西班牙語語音助手中的指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase