W

Wavlm Vindata Demo Dist

由 phongdtd 开发
基于microsoft/wavlm-base在越南语数据集上微调的自动语音识别模型
下载量 17
发布时间 : 3/2/2022

模型简介

该模型是基于WavLM架构的自动语音识别(ASR)模型,专门针对越南语语音识别任务进行了微调。

模型特点

越南语语音识别优化
在越南语数据集上专门微调,针对越南语语音特点进行了优化
基于WavLM架构
采用微软WavLM-base作为基础模型,具备强大的语音表示能力
多GPU训练
使用多GPU分布式训练,提高了训练效率

模型能力

越南语语音转文本
连续语音识别
语音内容理解

使用案例

语音转录
越南语会议记录
将越南语会议录音自动转录为文字记录
语音助手
为越南语语音助手提供语音识别能力
媒体处理
视频字幕生成
为越南语视频内容自动生成字幕
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase