W

Wav2vec2 Large Xlsr Persian V3

由m3hrdadfi開發
基於Facebook的wav2vec2-large-xlsr-53模型在波斯語通用語音庫上微調的自動語音識別(ASR)模型
下載量 1,888
發布時間 : 3/2/2022

模型概述

該模型專門用於波斯語(法爾西)的語音識別任務,通過XLSR架構的大規模預訓練和波斯語數據微調實現高準確率轉錄。

模型特點

低詞錯誤率
在波斯語測試集上達到10.36%的WER(詞錯誤率)
大規模預訓練
基於facebook/wav2vec2-large-xlsr-53的跨語言預訓練模型
專業數據微調
使用通用語音庫波斯語版數據進行針對性微調

模型能力

波斯語語音識別
16kHz音頻處理
長語音轉錄

使用案例

語音轉寫
波斯語語音轉錄
將波斯語語音內容轉換為文字
準確率約90%(WER 10.36%)
語音助手
波斯語語音指令識別
為波斯語語音助手提供核心識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase