W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Portuguese

由Edresson開發
這是一個基於 Facebook 的 Wav2vec2 Large 100k Voxpopuli 模型,使用 Common Voice 7.0 和 TTS-葡萄牙語語料庫在葡萄牙語上進行微調的自動語音識別模型。
下載量 20
發布時間 : 3/2/2022

模型概述

該模型主要用於葡萄牙語的自動語音識別任務,能夠將葡萄牙語語音轉換為文本。

模型特點

葡萄牙語優化
專門針對葡萄牙語語音進行微調,提高了識別準確率。
多數據集訓練
結合 Common Voice 和 TTS-葡萄牙語語料庫進行訓練,增強了模型的泛化能力。
高性能
在 Common Voice 7.0 測試集上達到 20.39% 的詞錯誤率。

模型能力

葡萄牙語語音識別
音頻轉文本
自動語音識別

使用案例

語音轉寫
葡萄牙語語音轉文本
將葡萄牙語語音內容自動轉換為文本格式
詞錯誤率 20.39%
語音助手
葡萄牙語語音命令識別
用於開發葡萄牙語語音助手和控制系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase