A

Asr Whisper Medium Commonvoice Ar

由speechbrain開發
基於CommonVoice阿拉伯語數據集微調的Whisper medium語音識別模型,由SpeechBrain團隊開發
下載量 17
發布時間 : 7/20/2023

模型概述

該模型是基於Whisper medium架構的自動語音識別系統,專門針對阿拉伯語進行了優化,在CommonVoice阿拉伯語數據集上微調

模型特點

高精度阿拉伯語識別
在CommonVoice阿拉伯語測試集上達到14.82%的WER
基於Whisper架構
利用OpenAI Whisper medium預訓練模型進行微調
端到端訓練
完整的編碼器-解碼器架構,直接輸出文本結果
自動音頻處理
內置音頻歸一化功能(重採樣+單聲道選擇)

模型能力

阿拉伯語語音識別
音頻轉錄
16kHz單聲道音頻處理

使用案例

語音轉錄
阿拉伯語語音轉文字
將阿拉伯語語音內容轉換為文本
測試集WER 14.82%,CER 4.95%
語音助手
阿拉伯語語音指令識別
用於阿拉伯語語音助手的前端語音識別模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase