whisper-large-v3-vaani-hindi开源印地语语音识别模型

首页

Whisper Large V3 Vaani Hindi

由 ARTPARK-IISc 开发

基于OpenAI的Whisper-Large-V3模型微调的印地语语音识别模型，训练数据包含约718小时的印地语转录语音

语音识别

Safetensors

开源协议:Apache-2.0 #印地语语音识别 #多数据集微调 #低词错误率

下载量 15.55k

发布时间 : 3/14/2025

模型简介

这是一个专门针对印地语优化的自动语音识别(ASR)模型，基于Whisper-large-v3架构微调，适用于印地语语音转录任务。

模型特点

印地语优化

专门针对印地语语音进行微调，提供更准确的转录结果

多数据集训练

融合了多个印地语语音数据集，增强模型泛化能力

长音频处理

支持30秒音频分块处理，适合长语音转录

模型能力

印地语语音识别

长音频转录

多场景语音处理

使用案例

语音转录

会议记录

将印地语会议录音转为文字记录

在Gramvaani数据集上WER为27.50

媒体字幕生成

为印地语视频内容生成字幕

在IndicTTS数据集上WER为4.38

语音分析

语音助手

构建印地语语音交互系统

在Commonvoice数据集上WER为16.86

数据集	字错率 (WER)
Gramvaani	27.50
Fleurs	13.11
IndicTTS	04.38
MUCS	22.26
Commonvoice	16.86
Kathbath	14.17
Kathbath Noisy	16.60
Vaani	25.55
RESPIN	16.14

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Whisper Large V3 Vaani Hindi

模型简介

模型特点

模型能力

使用案例

🚀 大语言模型Whisper-large-v3-vaani-hindi

🚀 快速开始

基础用法

📚 详细文档

训练与评估

📄 许可证