S

Sharif Wav2vec2

由SLPL開發
Sharif Wav2vec2針對波斯語的微調版本,基於Common Voice波斯語樣本訓練,支持自動語音識別任務。
下載量 88
發布時間 : 6/25/2022

模型概述

該模型是基於Wav2vec2架構的自動語音識別(ASR)模型,專門針對波斯語進行了微調。它使用了108小時的Common Voice波斯語樣本進行訓練,並集成了5gram語言模型以提高識別準確率。

模型特點

波斯語優化
專門針對波斯語進行微調,在Common Voice波斯語測試集上達到6.0%的WER
語言模型集成
集成了使用kenlm訓練的5gram語言模型,提高了在線ASR的準確率
高效處理
支持16kHz採樣率的語音輸入,適合即時語音識別應用

模型能力

波斯語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
波斯語語音轉文字
將波斯語語音內容轉換為文字
在Common Voice測試集上達到6%的詞錯誤率(WER)
語音助手
波斯語語音指令識別
用於波斯語語音助手或智能家居系統的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase