W

Wav2vec2 Base Vn 270h

由 dragonSwing 开发
基于约270小时越南语标注数据微调的语音识别模型,支持越南语自动语音识别任务
下载量 202
发布时间 : 3/2/2022

模型简介

该模型是基于Wav2Vec2架构的越南语自动语音识别(ASR)模型,使用Common Voice、VIVOS和VLSP2020等数据集共约270小时的标注语音数据进行微调。

模型特点

多数据集训练
整合了Common Voice、VIVOS和VLSP2020等多个越南语语音数据集进行训练
低词错误率
在VIVOS测试集上达到3.70%的WER,表现优异
支持语言模型
可配合4-gram语言模型使用,显著提升识别准确率

模型能力

越南语语音识别
音频转文本
16kHz采样率语音处理

使用案例

语音转录
越南语会议记录
将越南语会议录音自动转换为文字记录
准确率超过90%
语音助手
为越南语语音助手提供语音识别能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase