W

Wav2vec2 Large Xlsr 53 Arabic

由elgeish開發
基於facebook/wav2vec2-large-xlsr-53微調的阿拉伯語自動語音識別模型,支持16kHz採樣率的語音輸入
下載量 994
發布時間 : 3/2/2022

模型概述

該模型是針對阿拉伯語優化的自動語音識別系統,採用XLSR架構,在Common Voice和阿拉伯語音語料庫上微調訓練

模型特點

阿拉伯語優化
專門針對阿拉伯語語音特點進行微調,使用巴克瓦爾特轉寫系統處理阿拉伯文本
兩階段訓練
先在阿拉伯語音語料庫預訓練,再在Common Voice數據集上微調,優化識別效果
無需語言模型
可直接使用,無需額外語言模型支持

模型能力

阿拉伯語語音識別
16kHz採樣率音頻處理
自動轉寫阿拉伯語語音

使用案例

語音轉寫
阿拉伯語語音轉文本
將阿拉伯語語音內容自動轉寫為文本
在Common Voice測試集上達到26.55% WER
語音助手
阿拉伯語語音指令識別
用於阿拉伯語語音助手系統的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase