A

Asr Whisper Medium Commonvoice Fa

由speechbrain開發
基於CommonVoice-14.0波斯語數據集微調的whisper medium模型,用於波斯語自動語音識別任務。
下載量 21
發布時間 : 7/20/2023

模型概述

該模型是基於whisper-medium架構的自動語音識別系統,專門針對波斯語進行了優化,能夠將波斯語音頻轉換為文本。

模型特點

預訓練模型微調
基於預訓練的whisper-medium模型在波斯語數據上進行微調,保留了原模型的強大特徵提取能力
高效訓練
凍結了預訓練的whisper編碼器,只微調解碼器部分,提高了訓練效率
自動音頻處理
內置音頻標準化處理,包括自動重採樣和單聲道選擇

模型能力

波斯語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
波斯語語音轉文本
將波斯語音頻文件轉換為文本格式
在CommonVoice測試集上達到35.48%的詞錯誤率
語音助手
波斯語語音命令識別
用於構建波斯語語音助手的基礎識別模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase