W

Wav2vec2 Xls R 2b En To 15

由 facebook 开发
Facebook的Wav2Vec2 XLS-R模型,针对15种语言的语音翻译任务进行了微调,能够将英语口语翻译为多种书面语言。
下载量 27
发布时间 : 3/2/2022

模型简介

这是一个基于SpeechEncoderDecoderModel的语音翻译模型,能够将英语口语翻译为15种不同的书面语言。模型结合了强大的语音编码器和文本解码器,适用于多语言翻译场景。

模型特点

多语言支持
支持将英语口语翻译为15种不同的书面语言
大规模预训练
基于20亿参数的Wav2Vec2-XLS-R-2B模型,具有强大的语音理解能力
端到端翻译
直接从语音到文本的翻译,无需中间转录步骤
高质量翻译
在Covost2数据集上表现出色,提供准确的翻译结果

模型能力

英语语音识别
多语言文本翻译
端到端语音翻译
支持15种目标语言

使用案例

语音翻译
实时语音翻译
将英语口语实时翻译为目标语言的书面文本
在Covost2数据集上表现优异
多语言会议记录
将英语会议内容自动翻译为多种语言的会议记录
教育应用
语言学习辅助
帮助学习者理解英语口语并将其翻译为母语
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase