W

Whisper Large V2 Hi V3

由 anuragshas 开发
基于OpenAI Whisper Large-v2模型微调的印地语语音识别模型,在Common Voice 11.0印地语测试集上达到11.3%的词错误率
下载量 21
发布时间 : 12/15/2022

模型简介

这是一个专门针对印地语优化的自动语音识别(ASR)模型,基于OpenAI的Whisper架构,在Mozilla Common Voice数据集上进行了微调

模型特点

低词错误率
在印地语测试集上达到11.3%的词错误率,表现优异
多GPU训练优化
支持分布式多GPU训练,采用梯度累积技术提高训练效率
精细调优
在Common Voice印地语数据集上进行了1000步的精细调优

模型能力

印地语语音识别
语音转文本
长音频处理

使用案例

语音转录
印地语语音转录
将印地语语音内容转换为文本
11.3%的词错误率
语音助手
印地语语音指令识别
为印地语语音助手提供语音识别能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase