B

Bp500 Xlsr

由lgris開發
這是一個針對巴西葡萄牙語微調的Wav2vec 2.0模型,使用了多個巴西葡萄牙語數據集進行訓練,在Common Voice測試集上WER為13.6。
下載量 21
發布時間 : 3/2/2022

模型概述

該模型是基於Wav2vec 2.0架構的自動語音識別(ASR)模型,專門針對巴西葡萄牙語進行了優化。它整合了多個巴西葡萄牙語數據集,包括CETUC、Common Voice、LaPS BM等,總訓練數據量超過400小時。

模型特點

多數據集訓練
整合了7個不同的巴西葡萄牙語數據集,總訓練時長超過400小時
語言模型支持
支持與4-gram語言模型結合使用,可進一步提升識別準確率
低WER
在多個測試集上表現優異,平均WER為10.8%

模型能力

巴西葡萄牙語語音識別
支持多種音頻採樣率
可結合語言模型提升性能

使用案例

語音轉文字
語音轉錄
將巴西葡萄牙語語音內容轉換為文字
在Common Voice測試集上WER為13.6%
語音助手
巴西葡萄牙語語音指令識別
用於巴西葡萄牙語語音助手的前端語音識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase