W

Whisper Large V2 Punjabi

由 DrishtiSharma 开发
基于OpenAI Whisper-large-v2微调的旁遮普语自动语音识别模型,在Common Voice 11.0数据集上训练
下载量 27
发布时间 : 12/15/2022

模型简介

本模型是专门针对旁遮普语优化的自动语音识别(ASR)模型,基于OpenAI的Whisper-large-v2架构微调而成,适用于旁遮普语语音转文本任务。

模型特点

高精度旁遮普语识别
在Common Voice 11.0测试集上达到19.71%的词错误率(WER)
基于Whisper架构
利用OpenAI Whisper-large-v2的强大基础模型进行微调
开源许可
采用Apache 2.0许可证,允许商业和研究使用

模型能力

旁遮普语语音识别
语音转文本
长格式音频处理

使用案例

语音转录
旁遮普语内容转录
将旁遮普语播客、访谈等音频内容转换为文本
准确率约80.29% (基于WER计算)
辅助技术
旁遮普语字幕生成
为旁遮普语视频自动生成字幕
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase