W

Wav2vec2 Large Xlsr 53 Spanish With Lm

由patrickvonplaten開發
這是一個基於Wav2Vec2-Large-XLSR-53的西班牙語語音識別模型,增加了語言模型支持,顯著提升了識別準確率。
下載量 2,198
發布時間 : 3/2/2022

模型概述

該模型是jonatasgrosman/wav2vec2-large-xlsr-53-spanish的改進版本,通過集成語言模型支持,提高了西班牙語語音識別的準確率。

模型特點

語言模型集成
通過pyctcdecode庫集成語言模型,顯著提升識別準確率
性能提升
相比原模型,在西班牙語Common Voice測試集上WER降低20%
易用性
提供與Transformers無縫集成的處理器,使用方式與原模型基本一致

模型能力

西班牙語語音識別
音頻轉文本
大規模語音處理

使用案例

語音轉寫
西班牙語語音轉錄
將西班牙語語音內容轉換為文本
在Common Voice測試集上達到8.44% WER
語音助手
西班牙語語音指令識別
用於西班牙語語音助手的前端語音識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase