whisper-large-v2-cantonese开源粤语语音识别模型

Whisper Large V2 Cantonese

由 simonl0909 开发

基于OpenAI Whisper Large V2在粤语数据集上微调的自动语音识别模型，在测试集上达到6.7274%的字错误率

下载量 131

发布时间 : 12/11/2022

模型简介

专门针对粤语优化的语音识别模型，适用于粤语语音转文字任务

粤语优化

在Common Voice粤语数据集上微调，针对粤语语音识别进行了专门优化

低错误率

在测试集上达到6.7274%的字错误率(CER)，表现优异

基于Whisper架构

建立在强大的Whisper Large V2基础模型上，继承了其优秀的语音识别能力

粤语语音识别

语音转文字

自动语音转录

语音转录

粤语会议记录

将粤语会议内容自动转录为文字记录

字错误率6.7274%

粤语媒体字幕生成

为粤语视频内容自动生成字幕

语音助手

粤语语音交互

支持粤语语音命令识别

属性	详情
模型类型	Whisper Large V2 粤语版
训练数据	mozilla-foundation/common_voice_11_0 粤语数据集
评估指标	字符错误率（CER）
基础模型	openai/whisper-large-v2

任务类型	数据集	评估指标	指标值
自动语音识别	mozilla-foundation/common_voice_11_0（测试集）	字符错误率（CER）	6.7274
语音识别	Common Voice zh-HK	测试字符错误率（Test CER）	6.7274