W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Portuguese

由Edresson開發
這是一個基於Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0和TTS葡萄牙語數據集進行微調,並應用了數據增強技術的葡萄牙語語音識別模型。
下載量 22
發布時間 : 3/2/2022

模型概述

該模型專注於葡萄牙語語音識別任務,通過數據增強和額外TTS數據集微調提高了識別準確率。

模型特點

數據增強微調
使用TTS生成數據和語音轉換技術進行數據增強,提高了模型性能
多數據集訓練
結合Common Voice 7.0和專門TTS葡萄牙語數據集進行訓練
高性能識別
在Common Voice 7.0測試集上達到20.20%的詞錯誤率

模型能力

葡萄牙語語音識別
音頻轉文本
自動語音識別

使用案例

語音轉錄
葡萄牙語語音轉文字
將葡萄牙語語音內容轉換為文字
詞錯誤率20.20%
語音助手
葡萄牙語語音指令識別
用於葡萄牙語語音助手系統的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase