V

Viwav2vec2 Base 100h

由 dragonSwing 开发
基于VLSP数据集中100小时未标注越南语语音音频预训练的Wav2Vec2基础模型,需在下游任务上微调使用。
下载量 19
发布时间 : 3/2/2022

模型简介

这是一个基于Wav2Vec2架构的越南语语音预训练模型,使用16kHz采样率的语音数据进行训练,适用于自动语音识别等下游任务。

模型特点

越南语语音预训练
专门针对越南语语音数据进行预训练,适合越南语语音处理任务。
16kHz采样支持
模型训练使用16kHz采样率的语音数据,使用时需确保输入数据采样率一致。
基于Wav2Vec2架构
采用Facebook提出的Wav2Vec2架构,能够从原始音频中学习语音结构。

模型能力

语音特征提取
越南语语音识别

使用案例

语音技术
越南语自动语音识别
通过微调该模型实现越南语语音转文字功能
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase