W

Wavlm Vindata Demo Dist

由phongdtd開發
基於microsoft/wavlm-base在越南語數據集上微調的自動語音識別模型
下載量 17
發布時間 : 3/2/2022

模型概述

該模型是基於WavLM架構的自動語音識別(ASR)模型,專門針對越南語語音識別任務進行了微調。

模型特點

越南語語音識別優化
在越南語數據集上專門微調,針對越南語語音特點進行了優化
基於WavLM架構
採用微軟WavLM-base作為基礎模型,具備強大的語音表示能力
多GPU訓練
使用多GPU分佈式訓練,提高了訓練效率

模型能力

越南語語音轉文本
連續語音識別
語音內容理解

使用案例

語音轉錄
越南語會議記錄
將越南語會議錄音自動轉錄為文字記錄
語音助手
為越南語語音助手提供語音識別能力
媒體處理
視頻字幕生成
為越南語視頻內容自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase