X

Xls R 300m Es

由polodealvarado開發
基於西班牙語Common Voice數據集微調的語音識別模型,採用facebook/wav2vec2-xls-r-300m架構,在測試集上WER達到14.6%
下載量 23
發布時間 : 3/2/2022

模型概述

這是一個針對西班牙語優化的自動語音識別(ASR)模型,通過微調XLS-R-300M預訓練模型實現,適用於西班牙語語音轉文本任務。

模型特點

高性能西班牙語識別
在Common Voice 8.0西班牙語測試集上達到14.6%的WER指標
支持5-gram語言模型
內置n-gram(n=5)語言模型支持,可將WER進一步降低至10.9%
優化的訓練配置
採用線性學習率調度和混合精度訓練,經過13輪優化訓練

模型能力

西班牙語語音識別
即時語音轉文本
長音頻處理

使用案例

語音轉錄
西班牙語會議記錄
將西班牙語會議錄音自動轉換為文字記錄
準確率達85.4% (WER 14.6)
語音助手開發
用於開發西班牙語語音助手和對話系統
語音分析
語音內容分析
分析西班牙語語音內容進行情感分析或關鍵詞提取
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase