whisper-large-v2-punjabi開源模型 - 免費實現旁遮普語自動語音識別

Whisper Large V2 Punjabi

由DrishtiSharma開發

基於OpenAI Whisper-large-v2微調的旁遮普語自動語音識別模型，在Common Voice 11.0數據集上訓練

下載量 27

發布時間 : 12/15/2022

模型概述

本模型是專門針對旁遮普語優化的自動語音識別(ASR)模型，基於OpenAI的Whisper-large-v2架構微調而成，適用於旁遮普語語音轉文本任務。

高精度旁遮普語識別

在Common Voice 11.0測試集上達到19.71%的詞錯誤率(WER)

基於Whisper架構

利用OpenAI Whisper-large-v2的強大基礎模型進行微調

開源許可

採用Apache 2.0許可證，允許商業和研究使用

旁遮普語語音識別

語音轉文本

長格式音頻處理

語音轉錄

旁遮普語內容轉錄

將旁遮普語播客、訪談等音頻內容轉換為文本

準確率約80.29% (基於WER計算)

輔助技術

旁遮普語字幕生成

為旁遮普語視頻自動生成字幕