W

Wav2vec2 Large Xlsr 53 Coraa Brazilian Portuguese Gain Normalization

由alefiury開發
這是一個針對葡萄牙語進行微調的Wav2vec 2.0模型,訓練數據來源於多個葡萄牙語語音數據集,包括CORAA、CETUC、MLS等。
下載量 28
發布時間 : 3/27/2022

模型概述

該模型基於Wav2Vec 2.0架構,專門針對葡萄牙語語音識別任務進行了優化,能夠將葡萄牙語語音轉換為文本。

模型特點

多數據集訓練
模型整合了CORAA、CETUC、MLS、VoxForge和通用語音庫等多個葡萄牙語數據集進行訓練,提高了識別準確性。
低詞錯誤率
在CORAA測試集上實現了24.89%的詞錯誤率(WER),表現優異。
XLSR架構
基於大規模跨語言語音表示學習(XLSR)的Wav2Vec2架構,具有強大的語音特徵提取能力。

模型能力

葡萄牙語語音識別
語音轉文本
音頻處理

使用案例

語音轉錄
會議記錄自動轉錄
將葡萄牙語會議錄音自動轉換為文字記錄
24.89% WER
語音助手
為葡萄牙語語音助手提供語音識別能力
教育
語言學習應用
幫助學習者練習葡萄牙語發音和聽力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase