W

Wav2vec2 Large Xlsr Open Brazilian Portuguese V2

由lgris開發
這是一個針對巴西葡萄牙語優化的Wav2vec2模型,基於多個開放數據集訓練,用於自動語音識別任務。
下載量 1,825
發布時間 : 3/2/2022

模型概述

該模型是基於Wav2vec2架構的自動語音識別(ASR)模型,專門針對巴西葡萄牙語進行了微調。它整合了多個公開可用的巴西葡萄牙語語音數據集,能夠將葡萄牙語語音轉換為文本。

模型特點

多數據集訓練
整合了CETUC、MLS、VoxForge、Common Voice和Lapsbm等多個巴西葡萄牙語數據集,提高了模型的泛化能力
高性能
在Common Voice測試集上達到10.69%的詞錯誤率(WER)
開放許可
使用Apache 2.0許可證發佈,允許商業和研究使用

模型能力

巴西葡萄牙語語音識別
語音轉文本
支持多種音頻採樣率

使用案例

語音轉錄
會議記錄
將巴西葡萄牙語的會議錄音自動轉錄為文字記錄
在正式場合語音上表現良好
字幕生成
為巴西葡萄牙語視頻內容自動生成字幕
在清晰語音上準確率較高
語音助手
葡萄牙語語音命令識別
用於巴西葡萄牙語語音助手的基礎語音識別組件
適合命令和控制場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase