W

Wav2vec2 Large Xlsr 53 Spanish

由 facebook 开发
Facebook 发布的基于 Wav2Vec2 架构的大规模跨语言语音识别模型,专门针对西班牙语优化
下载量 66.63k
发布时间 : 3/2/2022

模型简介

该模型是基于 Wav2Vec2 架构的自动语音识别(ASR)模型,使用 XLSR-53 数据集训练,专门针对西班牙语语音识别任务进行了优化。

模型特点

跨语言预训练
基于XLSR-53数据集训练,具有跨语言迁移学习能力
高准确率
在Common Voice西班牙语测试集上达到17.6%的词错误率(WER)
端到端语音识别
直接从原始音频输入生成文本输出,无需复杂的特征工程

模型能力

西班牙语语音转文本
连续语音识别
音频特征提取

使用案例

语音转录
语音备忘录转录
将西班牙语语音备忘录自动转换为文本
准确率约82.4%
客服对话记录
自动记录和转录西班牙语客服电话内容
辅助技术
语音控制界面
为西班牙语用户提供语音控制功能
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase