B

Bp Voxforge1 Xlsr

由lgris開發
這是一個針對巴西葡萄牙語語音識別任務微調的Wav2Vec2模型,基於VoxForge數據集訓練。
下載量 21
發布時間 : 3/2/2022

模型概述

該模型是基於Facebook的Wav2Vec2架構,專門針對巴西葡萄牙語語音識別任務進行微調。它能夠將葡萄牙語語音轉換為文本,適用於多種巴西葡萄牙語方言。

模型特點

多數據集評估
模型在多個巴西葡萄牙語數據集上進行了全面評估,包括CETUC、Common Voice等7個不同數據集
語言模型集成
支持與4-gram語言模型結合使用,顯著降低詞錯誤率(WER)
輕量級解決方案
基於相對較小的VoxForge數據集(3.9小時)訓練,但仍能取得不錯的識別效果

模型能力

巴西葡萄牙語語音識別
語音轉文本
支持多種巴西方言

使用案例

語音轉錄
巴西葡萄牙語語音轉錄
將巴西葡萄牙語語音內容轉換為文本
平均詞錯誤率0.584(無語言模型)或0.454(使用4-gram語言模型)
語音助手
巴西葡萄牙語語音指令識別
用於巴西葡萄牙語語音助手的基礎識別組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase