W

Wav2vec2 Large Xlsr Pt

由gchhablani開發
基於facebook/wav2vec2-large-xlsr-53模型微調的葡萄牙語自動語音識別(ASR)模型,在Common Voice葡萄牙語數據集上達到17.22%詞錯誤率(WER)
下載量 29
發布時間 : 3/2/2022

模型概述

這是一個專門用於葡萄牙語語音識別的Wav2Vec2模型,支持將葡萄牙語語音轉換為文本,適用於需要葡萄牙語語音處理的應用場景。

模型特點

高精度葡萄牙語識別
在Common Voice葡萄牙語測試集上達到17.22%的詞錯誤率(WER)
基於XLSR-53預訓練模型
利用大規模跨語言語音表示學習(XLSR)的預訓練模型進行微調
無需語言模型
可直接使用,不需要額外的語言模型支持

模型能力

葡萄牙語語音識別
語音轉文本
16kHz音頻處理

使用案例

語音轉錄
葡萄牙語語音轉錄
將葡萄牙語語音內容轉換為文本
詞錯誤率17.22%
語音助手
葡萄牙語語音指令識別
用於葡萄牙語語音助手或語音控制系統的語音識別模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase