X

Xls R 300m Npsc Seq2seq

Developed by Rolv-Arild
该模型是一个自动语音识别(ASR)模型,在未指定数据集上训练,最终词错误率(WER)为0.3144。
Downloads 18
Release Time : 3/2/2022

Model Overview

这是一个自动语音识别模型,能够将语音转换为文本。

Model Features

低词错误率
在评估集上取得了0.3144的词错误率(WER),表现良好。
优化训练
使用了Adam优化器和线性学习率调度器进行训练,训练过程稳定。

Model Capabilities

语音转文本
自动语音识别

Use Cases

语音转录
会议记录
将会议录音自动转换为文字记录
词错误率0.3144
字幕生成
为视频内容自动生成字幕
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase