viwav2vec2-base-3k开源越南语语音模型 - 助力越南语语音识别任务

首页

Viwav2vec2 Base 3k

由 dragonSwing 开发

该模型是基于3千小时越南语语音数据预训练的Wav2Vec2基础模型，适用于越南语语音识别任务，需在下游任务上微调后使用。

语音识别

Transformers

其他#越南语语音识别 #16kHz音频适配 #自监督预训练

下载量 41

发布时间 : 5/3/2022

模型简介

这是一个通过3千小时越南语语音数据预训练的Wav2Vec2基础模型，包含自发性对话、朗读及广播语音数据。模型需要在下游任务（如越南语自动语音识别）上进行微调才能发挥最佳效果。

模型特点

大规模越南语预训练

基于3千小时的越南语语音数据预训练，包含多种语音类型

16kHz采样率支持

模型针对16kHz采样的语音数据优化，使用时需确保输入数据匹配此采样率

需下游任务微调

模型需要在下游任务（如语音识别）上进行微调才能发挥最佳效果

模型能力

越南语语音特征提取

语音表示学习

使用案例

语音技术

越南语语音识别系统

通过微调模型构建越南语自动语音识别系统

语音分析应用

用于越南语语音内容分析

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Viwav2vec2 Base 3k

模型简介

模型特点

模型能力

使用案例

🚀 基于3000小时越南语语音训练的Wav2Vec2基础模型

🚀 快速开始

💻 使用示例

基础用法

更多信息

📄 许可证