W

Wav2vec2 Large Xlsr 53 Punjabi

由kingabzpro開發
這是一個基於Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10在Common Voice數據集上微調的旁遮普語自動語音識別模型
下載量 189
發布時間 : 3/2/2022

模型概述

該模型用於旁遮普語的自動語音識別任務,能夠將旁遮普語語音轉換為文本

模型特點

高精度語音識別
在Common Voice pa-IN測試集上取得了36.02的WER和12.81的CER
基於大模型微調
基於Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10模型微調,繼承了強大的語音特徵提取能力
支持語言模型集成
支持與語言模型結合使用,提高識別準確率

模型能力

旁遮普語語音識別
語音轉文本
支持16kHz採樣率音頻處理

使用案例

語音轉錄
旁遮普語語音轉錄
將旁遮普語語音內容轉換為文本
在測試集上達到36.02 WER
語音助手
旁遮普語語音助手
用於開發支持旁遮普語的語音助手應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase