C

Ctrlv Wav2vec2 Tokenizer

由 proseph 开发
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了31.38%的词错误率
下载量 25
发布时间 : 4/20/2022

模型简介

该模型是基于wav2vec2架构的语音识别模型,适用于将语音转换为文本的任务

模型特点

高效微调
基于wav2vec2-base模型进行微调,在相对较小的数据集上取得了不错的效果
低词错误率
在评估集上取得了31.38%的词错误率,表现优于基础模型
优化训练
使用了线性学习率调度和1000步预热,训练过程稳定高效

模型能力

语音转文本
自动语音识别

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
准确率约68.62% (基于31.38% WER)
语音笔记
将语音备忘录转换为可搜索的文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase