A

Asr Wav2vec2 Commonvoice 14 Zh CN

由 speechbrain 开发
这是一个基于CommonVoice中文数据集训练的端到端自动语音识别系统,使用wav2vec2.0和CTC架构,支持中文语音识别。
下载量 36
发布时间 : 8/9/2023

模型简介

该模型是一个自动语音识别系统,专门针对中文语音设计,能够将中文语音转换为文本。它结合了预训练的wav2vec2.0模型和CTC解码器,在CommonVoice中文数据集上进行了微调。

模型特点

端到端语音识别
提供完整的语音到文本转换流程,无需额外的语言模型
基于wav2vec2.0预训练
使用facebook/wav2vec2-large-xlsr-53作为基础模型,具有强大的声学特征提取能力
中文优化
专门针对中文语音特点进行优化,在CommonVoice中文数据集上微调
轻量级推理
支持CPU和GPU推理,适合多种部署场景

模型能力

中文语音识别
音频转录
语音转文本

使用案例

语音转录
会议记录自动转录
将中文会议录音自动转换为文字记录
语音笔记转换
将用户的中文语音笔记转换为可编辑的文本
辅助技术
语音输入系统
为应用程序添加中文语音输入功能
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase