W

Wav2vec2 Base Vietnamese

由 dragonSwing 开发
基于Wav2Vec2架构的越南语语音识别模型,在VSLP数据集上微调,支持16kHz采样率的语音输入
下载量 16
发布时间 : 3/2/2022

模型简介

该模型是针对越南语优化的自动语音识别(ASR)系统,基于Facebook的Wav2Vec2架构,使用100小时标注数据微调,可直接用于语音转文本任务

模型特点

越南语优化
专门针对越南语语音特点进行训练和优化
无需语言模型
可直接使用,不需要额外的语言模型支持
高效处理
支持16kHz采样率的语音输入,适合实时应用场景

模型能力

越南语语音识别
语音转文本
自动语音识别

使用案例

语音转录
语音转写
将越南语语音内容转换为文本
在Common Voice测试集上WER为31.35%
智能助手
越南语语音指令识别
用于越南语智能语音助手的人机交互
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase