W

Wav2vec2 10

由 chrisvinsen 开发
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率(WER)为1.0
下载量 20
发布时间 : 5/23/2022

模型简介

该模型是基于wav2vec2架构的语音识别模型,经过微调后用于将语音转换为文本的任务

模型特点

低词错误率
在评估集上取得1.0的词错误率(WER)
基于wav2vec2架构
使用facebook/wav2vec2-base作为基础模型进行微调
优化训练
经过30轮训练,使用线性学习率调度器和Adam优化器

模型能力

语音识别
音频转文本

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
词错误率1.0
语音笔记
将语音备忘录转换为可搜索的文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase