S

S2t Medium Mustc Multilingual St

由 facebook 开发
基于Transformer的端到端多语言语音翻译模型,支持英语到多种语言的语音翻译
下载量 7,322
发布时间 : 3/2/2022

模型简介

该模型采用Transformer架构,专为端到端自动语音识别和语音翻译设计,通过卷积下采样器处理语音输入,并以自回归方式生成翻译结果。

模型特点

多语言支持
支持从英语到8种语言的语音翻译,包括法语、德语、西班牙语等。
端到端架构
采用端到端设计,直接从语音特征生成目标语言文本,简化了传统流水线系统。
高效语音处理
通过卷积下采样器将语音输入长度缩减3/4,提高处理效率。

模型能力

英语语音识别
多语言语音翻译
自动语音转文本

使用案例

语音翻译服务
实时语音翻译
将英语演讲或对话实时翻译为目标语言文本
在MuST-C测试集上达到24.5-34.9 BLEU分数
多媒体字幕生成
为英语视频内容生成多语言字幕
语言学习辅助
语言学习工具
帮助语言学习者理解英语语音内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase