A

Assignment1 Joane

由 Classroom-workshop 开发
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型
下载量 22
发布时间 : 6/2/2022

模型简介

该模型是一个端到端的序列到序列转换器模型,使用标准的自回归交叉熵损失进行训练,并自回归生成转录文本。

模型特点

端到端模型
直接从语音特征生成文本,无需中间处理步骤
高准确率
在LibriSpeech测试集上取得4.3(WER, clean)和9.0(WER, other)的优秀表现
自回归生成
使用自回归方式生成转录文本,提高生成质量

模型能力

英语语音识别
端到端语音转文本
实时语音转录

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
高准确率的转录文本
语音笔记
将语音备忘录转换为可搜索的文本
便于检索和整理的文本内容
辅助技术
听力辅助
为听力障碍者提供实时字幕
提高可访问性
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase