W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Portuguese

Developed by Edresson
这是一个基于Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0和TTS葡萄牙语数据集进行微调,并应用了数据增强技术的葡萄牙语语音识别模型。
Downloads 22
Release Time : 3/2/2022

Model Overview

该模型专注于葡萄牙语语音识别任务,通过数据增强和额外TTS数据集微调提高了识别准确率。

Model Features

数据增强微调
使用TTS生成数据和语音转换技术进行数据增强,提高了模型性能
多数据集训练
结合Common Voice 7.0和专门TTS葡萄牙语数据集进行训练
高性能识别
在Common Voice 7.0测试集上达到20.20%的词错误率

Model Capabilities

葡萄牙语语音识别
音频转文本
自动语音识别

Use Cases

语音转录
葡萄牙语语音转文字
将葡萄牙语语音内容转换为文字
词错误率20.20%
语音助手
葡萄牙语语音指令识别
用于葡萄牙语语音助手系统的语音指令识别
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase