B

Bp500 Base10k Voxpopuli

由lgris開發
這是一個針對巴西葡萄牙語優化的Wav2vec 2.0語音識別模型,基於多個巴西葡萄牙語數據集微調
下載量 23
發布時間 : 3/2/2022

模型概述

該模型是基於Wav2vec 2.0架構的自動語音識別(ASR)系統,專門針對巴西葡萄牙語優化,在多個巴西葡萄牙語數據集上表現出色

模型特點

多數據集訓練
融合了CETUC、Common Voice、LaPS BM等多個巴西葡萄牙語數據集,總計超過450小時訓練數據
語言模型支持
可結合4-gram語言模型進一步提升識別準確率
廣泛測試驗證
在7個不同測試集上進行了全面評估,平均WER為18.1%

模型能力

巴西葡萄牙語語音識別
語音轉文本
支持16kHz採樣率音頻處理

使用案例

語音轉錄
巴西葡萄牙語語音轉錄
將巴西葡萄牙語語音轉換為文本
在CETUC測試集上WER為12.0%,結合語言模型後可降至7.5%
語音助手
巴西葡萄牙語語音指令識別
用於巴西葡萄牙語語音助手或智能家居設備的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase