W

Wav2vec2 Base Vietnamese 160h

由khanhld開發
基於Wav2vec2的越南語語音識別模型,在160小時越南語語音數據上微調
下載量 356
發布時間 : 5/7/2022

模型概述

該模型是基於Wav2vec2架構的越南語自動語音識別(ASR)模型,在約160小時的越南語語音數據集上微調而成,支持越南語語音轉文本任務。

模型特點

多數據集訓練
模型在VIVOS、COMMON VOICE、FOSD和VLSP等多個越南語語音數據集上訓練
無語言模型支持
即使未集成語言模型,仍能取得較好的識別效果
開源實現
提供完整的預訓練和微調代碼,支持自定義數據集訓練

模型能力

越南語語音識別
音頻轉文本
語音轉錄

使用案例

語音轉錄
越南語語音轉寫
將越南語語音內容轉換為文本
在Common Voice越南語測試集上WER為10.78%
語音助手
越南語語音指令識別
用於越南語語音助手的前端語音識別模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase