X

Xls R 300m Npsc Seq2seq

由 Rolv-Arild 开发
该模型是一个自动语音识别(ASR)模型,在未指定数据集上训练,最终词错误率(WER)为0.3144。
下载量 18
发布时间 : 3/2/2022

模型简介

这是一个自动语音识别模型,能够将语音转换为文本。

模型特点

低词错误率
在评估集上取得了0.3144的词错误率(WER),表现良好。
优化训练
使用了Adam优化器和线性学习率调度器进行训练,训练过程稳定。

模型能力

语音转文本
自动语音识别

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
词错误率0.3144
字幕生成
为视频内容自动生成字幕
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase