S

S2t Medium Librispeech Asr

Developed by facebook
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
Downloads 1,086
Release Time : 3/2/2022

Model Overview

该模型是一个端到端的序列到序列转换器模型,使用标准的自回归交叉熵损失进行训练,能够将语音转换为文本

Model Features

端到端语音识别
直接从语音特征生成文本,无需中间处理步骤
自回归生成
使用自回归方式逐步生成转录文本
LibriSpeech训练
在LibriSpeech数据集上训练,适合英语语音识别

Model Capabilities

语音识别
英语转录
端到端语音转文本

Use Cases

语音转录
会议记录
将会议录音自动转换为文字记录
语音笔记
将语音备忘录转换为可搜索的文本
辅助技术
实时字幕
为听力障碍者提供实时语音转文字服务
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase