W

Wav2vec2 Base Timit Fine Tuned

由 patrickvonplaten 开发
该模型是基于facebook/wav2vec2-base在TIMIT_ASR数据集上微调的自动语音识别(ASR)模型,在评估集上取得了0.2151的词错误率(WER)。
下载量 21
发布时间 : 3/2/2022

模型简介

基于wav2vec2架构的语音识别模型,专门针对TIMIT_ASR数据集进行微调,适用于英语语音识别任务。

模型特点

TIMIT数据集微调
专门针对TIMIT ASR数据集进行优化,提高了在该数据集上的识别准确率
低词错误率
在评估集上取得了0.2151的词错误率(WER),表现良好
基于wav2vec2架构
采用Facebook的wav2vec2-base架构,具有强大的语音特征提取能力

模型能力

英语语音识别
语音转文本
自动语音转录

使用案例

语音识别
语音转录
将英语语音内容转换为文本
词错误率0.2151
语音指令识别
识别和理解语音指令
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase