W

Wav2vec2 Large Xlsr 53 Toy Train Data Augment 0.1.csv

由 scasutt 开发
该模型是基于facebook/wav2vec2-base微调的语音识别模型,使用数据增强技术训练
下载量 22
发布时间 : 3/25/2022

模型简介

基于wav2vec2架构的语音识别模型,适用于自动语音转文本任务,支持XLSR-53多语言特征

模型特点

数据增强训练
使用数据增强技术(增强比例为0.1)进行训练,可能提升模型鲁棒性
多语言特征
基于XLSR-53架构,可能具备跨语言迁移学习能力

模型能力

语音识别
自动语音转文本

使用案例

语音转录
会议记录自动转录
将会议录音自动转换为文字记录
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase