W

Wav2vec2 Large Xls R 300m Vietnamese Colab

由 Jungwonchang 开发
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的越南语语音识别模型
下载量 22
发布时间 : 3/17/2022

模型简介

这是一个针对越南语优化的语音识别模型,基于wav2vec2架构,适用于越南语语音转文本任务

模型特点

越南语优化
针对越南语进行了专门微调,提高越南语语音识别准确率
基于XLS-R架构
采用Facebook的XLS-R大规模跨语言语音表示学习架构
中等规模
3亿参数的平衡模型,兼顾性能和效率

模型能力

越南语语音识别
语音转文本
自动语音转录

使用案例

语音转录
越南语会议记录
将越南语会议录音自动转换为文字记录
语音助手
为越南语语音助手提供语音识别能力
教育
语言学习应用
帮助学习者练习越南语发音和听力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase