W

Wav2vec2 Xls R 2b 21 To En

由 facebook 开发
Facebook的Wav2Vec2 XLS-R模型,用于多语言语音到英语的翻译任务。
下载量 38
发布时间 : 3/2/2022

模型简介

该模型是一个基于Wav2Vec2 XLS-R架构的语音翻译模型,能够将21种语言的语音输入翻译为英语文本。

模型特点

多语言支持
支持21种不同语言的语音输入翻译为英语
大规模模型
基于20亿参数的Wav2Vec2 XLS-R架构,提供高质量的翻译效果
端到端翻译
直接从语音输入到英语文本的端到端翻译,无需中间转录步骤

模型能力

语音翻译
多语言处理
自动语音识别

使用案例

语音翻译服务
实时语音翻译
将会议或对话中的外语语音实时翻译为英语
语音内容本地化
将外语播客、视频等内容翻译为英语文本
辅助技术
无障碍应用
帮助听力障碍者理解外语语音内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase