W

Wav2vec2 Large Xlsr 53 Es

由pcuenq開發
基於Facebook的wav2vec2-large-xlsr-53模型,在西班牙語Common Voice數據集上微調的語音識別模型,測試WER為10.50%。
下載量 147
發布時間 : 3/2/2022

模型概述

這是一個針對西班牙語優化的自動語音識別(ASR)模型,能夠將西班牙語語音轉換為文本。

模型特點

低詞錯誤率
在Common Voice西班牙語測試集上達到10.50%的WER
保留變音符號
保留了西班牙語中的變音符號,確保語義準確性
無需語言模型
可直接使用,無需額外語言模型支持
多階段訓練
採用分階段訓練策略,逐步優化模型性能

模型能力

西班牙語語音識別
16kHz音頻處理
批量語音轉文本

使用案例

語音轉錄
西班牙語語音轉文字
將西班牙語語音內容轉換為文本格式
準確率約89.5% (WER 10.5%)
語音助手
西班牙語語音指令識別
用於西班牙語語音助手的基礎識別組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase