B

Bp Tedx100 Xlsr

由lgris開發
基於TEDx葡萄牙語數據集微調的巴西葡萄牙語Wav2vec 2.0語音識別模型
下載量 23
發布時間 : 3/2/2022

模型概述

該模型使用Wav2vec 2.0架構,在TEDx葡萄牙語多語言數據集上進行微調,專門用於巴西葡萄牙語的自動語音識別任務。

模型特點

多數據集訓練
模型在多個葡萄牙語語音數據集上進行評估,包括CETUC、通用語音等
語言模型支持
可結合4-gram語言模型進一步提升識別準確率
高性能
在多個測試集上表現優異,平均詞錯誤率(WER)為0.321

模型能力

巴西葡萄牙語語音識別
音頻轉文本
支持多種音頻格式處理

使用案例

語音轉錄
演講內容轉錄
將TEDx葡萄牙語演講內容自動轉換為文本
詞錯誤率0.222
商業語音轉錄
商業會議錄音轉文字
在LaPS BM數據集上詞錯誤率0.169
語音分析
語音內容分析
對葡萄牙語語音內容進行文本分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase