W

Wav2vec2 Large Xlsr Punjabi

由manandey開發
這是一個基於facebook/wav2vec2-large-xlsr-53模型在旁遮普語語音數據上微調的自動語音識別(ASR)模型。
下載量 20.46k
發布時間 : 3/2/2022

模型概述

該模型專門用於旁遮普語的語音識別任務,基於通用語音數據集進行訓練,支持16kHz採樣率的語音輸入。

模型特點

旁遮普語語音識別
專門針對旁遮普語優化的語音識別能力
基於XLSR大模型
基於facebook的wav2vec2-large-xlsr-53模型微調,具有強大的語音特徵提取能力
16kHz採樣率支持
支持16kHz採樣率的語音輸入處理

模型能力

語音識別
旁遮普語語音轉文本

使用案例

語音轉錄
旁遮普語語音轉錄
將旁遮普語語音轉換為文本
詞錯誤率57.31%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase