whisper-large-v3-vaani-hindi開源印地語語音識別模型

首頁

Whisper Large V3 Vaani Hindi

由ARTPARK-IISc開發

基於OpenAI的Whisper-Large-V3模型微調的印地語語音識別模型，訓練數據包含約718小時的印地語轉錄語音

語音識別

Safetensors

開源協議:Apache-2.0 #印地語語音識別 #多數據集微調 #低詞錯誤率

下載量 15.55k

發布時間 : 3/14/2025

模型概述

這是一個專門針對印地語優化的自動語音識別(ASR)模型，基於Whisper-large-v3架構微調，適用於印地語語音轉錄任務。

模型特點

印地語優化

專門針對印地語語音進行微調，提供更準確的轉錄結果

多數據集訓練

融合了多個印地語語音數據集，增強模型泛化能力

長音頻處理

支持30秒音頻分塊處理，適合長語音轉錄

模型能力

印地語語音識別

長音頻轉錄

多場景語音處理

使用案例

語音轉錄

會議記錄

將印地語會議錄音轉為文字記錄

在Gramvaani數據集上WER為27.50

媒體字幕生成

為印地語視頻內容生成字幕

在IndicTTS數據集上WER為4.38

語音分析

語音助手

構建印地語語音交互系統

在Commonvoice數據集上WER為16.86

數據集	字錯率 (WER)
Gramvaani	27.50
Fleurs	13.11
IndicTTS	04.38
MUCS	22.26
Commonvoice	16.86
Kathbath	14.17
Kathbath Noisy	16.60
Vaani	25.55
RESPIN	16.14

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Whisper Large V3 Vaani Hindi

模型概述

模型特點

模型能力

使用案例

🚀 大語言模型Whisper-large-v3-vaani-hindi

🚀 快速開始

基礎用法

📚 詳細文檔

訓練與評估

📄 許可證