whisper-large-v2-punjabi开源模型 - 免费实现旁遮普语自动语音识别

Whisper Large V2 Punjabi

由 DrishtiSharma 开发

基于OpenAI Whisper-large-v2微调的旁遮普语自动语音识别模型，在Common Voice 11.0数据集上训练

下载量 27

发布时间 : 12/15/2022

模型简介

本模型是专门针对旁遮普语优化的自动语音识别(ASR)模型，基于OpenAI的Whisper-large-v2架构微调而成，适用于旁遮普语语音转文本任务。

高精度旁遮普语识别

在Common Voice 11.0测试集上达到19.71%的词错误率(WER)

基于Whisper架构

利用OpenAI Whisper-large-v2的强大基础模型进行微调

开源许可

采用Apache 2.0许可证，允许商业和研究使用

旁遮普语语音识别

语音转文本

长格式音频处理

语音转录

旁遮普语内容转录

将旁遮普语播客、访谈等音频内容转换为文本

准确率约80.29% (基于WER计算)

辅助技术

旁遮普语字幕生成

为旁遮普语视频自动生成字幕