A

Asr Wav2vec2 Commonvoice 14 Es

由 speechbrain 开发
这是一个基于CommonVoice西班牙语数据集训练的端到端自动语音识别系统,使用wav2vec 2.0预训练模型结合CTC解码器。
下载量 22
发布时间 : 8/9/2023

模型简介

该模型用于西班牙语语音识别,由分词器和声学模型组成,能够将西班牙语音频转换为文本。

模型特点

端到端语音识别
提供完整的语音识别流程,从音频输入到文本输出
基于wav2vec 2.0预训练模型
使用facebook/wav2vec2-large-xlsr-53预训练模型作为基础,具有强大的声学特征提取能力
CTC解码器
采用CTC(Connectionist Temporal Classification)作为解码器,适合序列到序列的任务
无需语言模型
系统不依赖外部语言模型即可完成语音识别

模型能力

西班牙语语音识别
音频转录
16kHz单声道音频处理

使用案例

语音转录
西班牙语语音转文字
将西班牙语语音内容转换为文本形式
测试词错误率13.28%,字错误率3.80%
语音助手
西班牙语语音指令识别
用于西班牙语语音助手或智能家居设备的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase