W

Wav2vec2 Large Xlsr 53 English

由 Xenova 开发
基于wav2vec 2.0架构的大规模语音识别模型,支持英语语音转文本
下载量 14
发布时间 : 7/26/2023

模型简介

该模型是基于Facebook的wav2vec 2.0架构开发的自动语音识别(ASR)模型,专门针对英语语音进行优化,能够将英语语音准确转换为文本。

模型特点

高精度英语识别
针对英语语音优化的模型,提供高准确率的语音转文本能力
基于wav2vec 2.0架构
采用Facebook开发的先进语音识别架构,具有强大的特征提取能力
Web兼容性
提供ONNX格式权重,便于在Web环境中部署和使用

模型能力

英语语音识别
实时语音转文本
音频文件转录

使用案例

语音转录
会议记录
将英语会议录音自动转换为文字记录
提高会议记录效率,便于后续检索和分析
播客转录
将英语播客内容转换为文本
便于内容索引和文字版发布
辅助工具
实时字幕生成
为英语视频或直播生成实时字幕
提高内容可访问性
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase