W

Wav2vec2 Base 10k Voxpopuli

由 facebook 开发
基于VoxPopuli语料库1万条未标注数据预训练的语音识别基础模型,支持多语言语音处理
下载量 2,504
发布时间 : 3/2/2022

模型简介

Facebook开发的Wav2Vec2语音识别基础模型,通过自监督学习从原始音频中提取语音特征,适用于多语言自动语音识别任务

模型特点

多语言支持
基于VoxPopuli多语言语料库训练,支持多种语言的语音识别
自监督预训练
使用1万小时未标注语音数据进行自监督学习,有效捕捉语音特征
可微调架构
提供基础模型架构,可针对特定语言或领域进行微调

模型能力

自动语音识别
语音特征提取
多语言语音处理

使用案例

语音转文字
会议记录自动化
将会议录音自动转换为文字记录
字幕生成
为视频内容自动生成字幕
语音分析
语音内容分析
从语音数据中提取关键信息进行分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase