W

Wav2vec2 Large Xls R 300m Pt Colab

由 tonyalves 开发
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型
下载量 17
发布时间 : 3/2/2022

模型简介

该模型是一个用于语音识别任务的预训练模型,经过微调后能够将语音转换为文本。

模型特点

高效语音识别
基于wav2vec2架构,能够高效准确地将语音转换为文本
大规模预训练
基于3亿参数的大规模预训练模型,具有强大的特征提取能力
微调优化
在common_voice数据集上进行微调,优化了识别性能

模型能力

语音识别
音频转文本
自动语音转录

使用案例

语音转录
会议记录
自动将会议录音转换为文字记录
词错误率约30%
字幕生成
为视频内容自动生成字幕
语音助手
语音指令识别
识别用户语音指令
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase