T

Test

由 GleamEyeBeast 开发
该模型是基于facebook/wav2vec2-base-960h微调的语音识别模型,在评估集上取得了21.61%的词错误率。
下载量 21
发布时间 : 3/2/2022

模型简介

这是一个用于语音识别任务的微调模型,基于Facebook的wav2vec2架构,适用于英语语音转文本任务。

模型特点

高效微调
基于预训练的wav2vec2模型进行微调,在有限数据上实现快速适应
低词错误率
在评估集上取得了21.61%的词错误率,表现良好
轻量级
基于wav2vec2-base架构,相比更大模型具有更低的计算资源需求

模型能力

英语语音识别
音频转文本
语音转录

使用案例

语音转录
会议记录
将英语会议录音自动转录为文字记录
准确率约78.39%(基于21.61%的词错误率)
语音笔记
将英语语音笔记转换为可搜索的文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase