W

Whisper Large V2 Cantonese

由 simonl0909 开发
基于OpenAI Whisper Large V2在粤语数据集上微调的自动语音识别模型,在测试集上达到6.7274%的字错误率
下载量 131
发布时间 : 12/11/2022

模型简介

专门针对粤语优化的语音识别模型,适用于粤语语音转文字任务

模型特点

粤语优化
在Common Voice粤语数据集上微调,针对粤语语音识别进行了专门优化
低错误率
在测试集上达到6.7274%的字错误率(CER),表现优异
基于Whisper架构
建立在强大的Whisper Large V2基础模型上,继承了其优秀的语音识别能力

模型能力

粤语语音识别
语音转文字
自动语音转录

使用案例

语音转录
粤语会议记录
将粤语会议内容自动转录为文字记录
字错误率6.7274%
粤语媒体字幕生成
为粤语视频内容自动生成字幕
语音助手
粤语语音交互
支持粤语语音命令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase