W

Wav2vec2 Base Toy Train Data Masked Audio 10ms

由 scasutt 开发
基于facebook/wav2vec2-base微调的语音识别模型,在10ms音频掩码任务上训练
下载量 22
发布时间 : 3/26/2022

模型简介

该模型是wav2vec2-base的微调版本,专注于处理带掩码的音频数据,适用于语音识别任务。

模型特点

10ms音频掩码处理
专门针对10ms间隔的掩码音频数据进行优化训练
基于wav2vec2-base微调
在成熟的wav2vec2-base架构基础上进行针对性优化

模型能力

语音识别
带掩码音频处理

使用案例

语音处理
不完整音频识别
识别部分被掩码或缺失的语音内容
WER 0.7145
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase