V

Viwav2vec2 Base 1.5k

由 dragonSwing 开发
该模型通过1.5千小时越南语语音数据预训练得到,适用于越南语语音识别任务,需微调后使用。
下载量 38
发布时间 : 5/3/2022

模型简介

基于Wav2Vec2架构的越南语语音预训练模型,使用1.5千小时的朗读与广播语音数据进行训练,支持16kHz采样率的语音输入。

模型特点

大规模越南语预训练
使用1.5千小时的越南语语音数据进行预训练,涵盖朗读与广播语音
16kHz采样支持
模型针对16kHz采样的语音数据优化,使用时需确保输入语音采样率匹配
需微调使用
模型需在下游任务(如越南语ASR)上进行微调才能发挥最佳效果

模型能力

越南语语音特征提取
语音表示学习

使用案例

语音技术
越南语语音识别系统
通过微调模型构建越南语ASR系统
语音分析
用于越南语语音特征分析和表示学习
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase