W

Wavlm VLSP Vi

由phongdtd開發
基於microsoft/wavlm-base-plus在PHONGDTD/VINDATAVLSP - NA數據集上微調的越南語自動語音識別模型
下載量 21
發布時間 : 3/2/2022

模型概述

該模型是針對越南語的自動語音識別(ASR)任務進行優化的模型,基於WavLM架構微調而成

模型特點

越南語優化
專門針對越南語語音識別任務進行微調
基於WavLM架構
使用微軟WavLM-base-plus作為基礎模型,具有強大的語音表示能力
多GPU訓練
採用分佈式多GPU訓練方式,提高訓練效率

模型能力

越南語語音轉文本
連續語音識別

使用案例

語音轉錄
越南語會議記錄
將越南語會議錄音轉換為文字記錄
語音助手
為越南語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase