W

Whisper Large V2 Punjabi

由DrishtiSharma開發
基於OpenAI Whisper-large-v2微調的旁遮普語自動語音識別模型,在Common Voice 11.0數據集上訓練
下載量 27
發布時間 : 12/15/2022

模型概述

本模型是專門針對旁遮普語優化的自動語音識別(ASR)模型,基於OpenAI的Whisper-large-v2架構微調而成,適用於旁遮普語語音轉文本任務。

模型特點

高精度旁遮普語識別
在Common Voice 11.0測試集上達到19.71%的詞錯誤率(WER)
基於Whisper架構
利用OpenAI Whisper-large-v2的強大基礎模型進行微調
開源許可
採用Apache 2.0許可證,允許商業和研究使用

模型能力

旁遮普語語音識別
語音轉文本
長格式音頻處理

使用案例

語音轉錄
旁遮普語內容轉錄
將旁遮普語播客、訪談等音頻內容轉換為文本
準確率約80.29% (基於WER計算)
輔助技術
旁遮普語字幕生成
為旁遮普語視頻自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase