whisper-hindi-small開源語音識別模型 - 免費部署精準識別印地語語音

首頁

Whisper Hindi Small

由vasista22開發

基於OpenAI Whisper-small微調的印地語語音識別模型，在多個公開ASR語料庫上訓練

語音識別其他開源協議:Apache-2.0 #印地語語音識別 #低詞錯誤率 #多場景適配

下載量 477

發布時間 : 1/8/2023

模型概述

這是一個專門針對印地語優化的自動語音識別(ASR)模型，基於OpenAI的Whisper-small架構微調而成。主要用於將印地語語音轉換為文本。

模型特點

印地語優化

專門針對印地語語音識別進行微調優化

多數據集訓練

在GramVaani、ULCA、Shrutilipi等多個公開印地語ASR語料庫上訓練

高效推理支持

支持使用whisper-jax進行加速推理

模型能力

印地語語音識別

長音頻處理(支持分塊處理)

使用案例

語音轉寫

印地語語音轉錄

將印地語語音內容轉換為文本

🚀 印地語小型Whisper模型

本模型是基於多個公開可用的自動語音識別（ASR）語料庫中的印地語數據，對 openai/whisper-small 進行微調後的版本。它是 Whisper 微調衝刺活動的一部分。

重要說明

本模型的訓練代碼可在 whisper-finetune 倉庫中複用。

🚀 快速開始

若要在整個數據集上評估此模型，可使用 whisper-finetune 倉庫中的評估代碼。該倉庫還提供了使用 whisper-jax 進行快速推理的腳本。

💻 使用示例

基礎用法

若要使用此模型對單個音頻文件進行推理，可使用以下代碼片段：

>>> import torch
>>> from transformers import pipeline

>>> # path to the audio file to be transcribed
>>> audio = "/path/to/audio.format"
>>> device = "cuda:0" if torch.cuda.is_available() else "cpu"

>>> transcribe = pipeline(task="automatic-speech-recognition", model="vasista22/whisper-hindi-small", chunk_length_s=30, device=device)
>>> transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(language="hi", task="transcribe")

>>> print('Transcription: ', transcribe(audio)["text"])

高級用法

若要對 Whisper 模型進行快速推理，可使用 whisper-jax 庫。請按照此處所述的必要安裝步驟操作，然後使用以下代碼片段：

>>> import jax.numpy as jnp
>>> from whisper_jax import FlaxWhisperForConditionalGeneration, FlaxWhisperPipline

>>> # path to the audio file to be transcribed
>>> audio = "/path/to/audio.format"

>>> transcribe = FlaxWhisperPipline("vasista22/whisper-hindi-small", batch_size=16)
>>> transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(language="hi", task="transcribe")

>>> print('Transcription: ', transcribe(audio)["text"])

📚 詳細文檔

訓練和評估數據

訓練數據：
評估數據：
- GramVaani ASR 語料庫測試集
- Google/Fleurs 測試集

訓練超參數

訓練期間使用了以下超參數：

屬性	詳情
學習率	1.75e-05
訓練批次大小	48
評估批次大小	32
隨機種子	22
優化器	adamw_bnb_8bit
學習率調度器類型	linear
學習率調度器熱身步數	20000
訓練步數	19377（初始設置為 129180 步）
混合精度訓練	True