W

Wav2vec2 3

由 chrisvinsen 开发
基于facebook/wav2vec2-base微调的语音识别模型,词错误率(WER)为1.0
下载量 16
发布时间 : 5/22/2022

模型简介

该模型是基于wav2vec2架构的语音识别模型,经过微调后可用于语音转文本任务

模型特点

低词错误率
在评估集上取得了1.0的词错误率(WER)
基于wav2vec2架构
使用facebook/wav2vec2-base作为基础模型进行微调

模型能力

语音识别
音频转文本

使用案例

语音转录
会议记录
将会议录音转换为文字记录
语音笔记
将语音备忘录转换为文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase