W

Wav2vec2 Xls R 300m Mixed

由 mesolitica 开发
基于Facebook的wav2vec2-xls-r-300m模型在混合语言数据集上微调的语音识别模型,支持马来语、新加坡式英语和普通话。
下载量 10.07k
发布时间 : 6/1/2022

模型简介

该模型是针对三种语言(马来语、新加坡式英语和普通话)进行微调的语音识别模型,适用于多语言语音转文本任务。

模型特点

多语言支持
支持马来语、新加坡式英语和普通话三种语言的语音识别。
高性能
在评估集上表现出色,字错误率(CER)和词错误率(WER)均较低。
语言模型增强
支持结合外部语言模型进一步提升识别准确率。

模型能力

语音识别
多语言处理
语音转文本

使用案例

语音转写
多语言会议记录
用于记录包含马来语、新加坡式英语和普通话的会议内容。
准确转写混合语言会议内容
客服对话分析
分析多语言客服对话内容。
提高客服质量分析效率
教育
语言学习辅助
帮助学习者练习和评估发音准确性。
提供即时发音反馈
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase