A

Asr Whisper Large V2 Commonvoice Fa

由speechbrain開發
這是一個基於whisper-large-v2架構的自動語音識別模型,專門針對波斯語在CommonVoice數據集上進行了微調。
下載量 103
發布時間 : 1/30/2023

模型概述

該模型用於波斯語的自動語音識別任務,採用whisper編碼器-解碼器架構,在CommonVoice波斯語數據集上微調獲得。

模型特點

高性能波斯語識別
在CommonVoice波斯語測試集上達到31.75%的詞錯誤率(WER)和9.38%的字符錯誤率(CER)
基於預訓練模型
使用預訓練的whisper-large-v2模型作為基礎,編碼器部分保持凍結
端到端訓練
整個系統採用端到端方式訓練,簡化了語音識別流程

模型能力

波斯語語音識別
16kHz音頻處理
自動音頻標準化

使用案例

語音轉寫
波斯語語音轉錄
將波斯語語音內容轉換為文本
在測試集上達到31.75%的詞錯誤率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase