V

Viwav2vec2 Base 3k

由 dragonSwing 开发
该模型是基于3千小时越南语语音数据预训练的Wav2Vec2基础模型,适用于越南语语音识别任务,需在下游任务上微调后使用。
下载量 41
发布时间 : 5/3/2022

模型简介

这是一个通过3千小时越南语语音数据预训练的Wav2Vec2基础模型,包含自发性对话、朗读及广播语音数据。模型需要在下游任务(如越南语自动语音识别)上进行微调才能发挥最佳效果。

模型特点

大规模越南语预训练
基于3千小时的越南语语音数据预训练,包含多种语音类型
16kHz采样率支持
模型针对16kHz采样的语音数据优化,使用时需确保输入数据匹配此采样率
需下游任务微调
模型需要在下游任务(如语音识别)上进行微调才能发挥最佳效果

模型能力

越南语语音特征提取
语音表示学习

使用案例

语音技术
越南语语音识别系统
通过微调模型构建越南语自动语音识别系统
语音分析应用
用于越南语语音内容分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase