W

Wav2vec2 Large Xls R 300m Pun Colab

由 shibli 开发
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型
下载量 20
发布时间 : 3/2/2022

模型简介

该模型是wav2vec2-xls-r-300m的微调版本,专注于语音识别任务,特别适用于处理common_voice数据集中的语音内容。

模型特点

大规模预训练模型微调
基于3亿参数的wav2vec2-xls-r-300m模型进行微调,具备强大的语音特征提取能力
Common Voice数据集优化
专门针对Common Voice数据集进行优化,可能在该数据集上表现更佳
高效训练配置
采用混合精度训练和梯度累积等技术,提高训练效率

模型能力

语音识别
语音转文本
音频内容理解

使用案例

语音转录
语音内容转录
将语音内容转换为文本格式
语音助手
语音命令识别
识别和理解语音命令
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase