hamsa-v0.1-beta開源阿拉伯語語音識別模型 - 滿足中東和北非語言需求

Hamsa V0.1 Beta

由nadsoft開發

Hamsa是基於Whisper模型構建的阿拉伯語語音識別模型，專注於中東和北非地區的語言需求。

下載量 46

發布時間 : 10/20/2023

模型概述

Hamsa（همسة）是一個預訓練的阿拉伯語自動語音識別（ASR）模型，致力於解決阿拉伯語獨特的語言細微差異，特別適合中東和北非地區使用。

阿拉伯語優化

專門針對阿拉伯語進行優化，解決中東和北非地區特有的語言細微差異。

多數據源訓練

結合多個阿拉伯語語音數據集進行訓練，包括nadsoft/Jordan-Audio、google/fleurs和common_voice_11_0。

技術先進

採用Whisper模型架構，使用Adam優化器和混合精度訓練等先進技術。

阿拉伯語語音識別

標準阿拉伯語轉錄

語音轉文本

語音轉錄

標準阿拉伯語轉錄

將標準阿拉伯語語音轉換為文本

詞錯誤率（WER）為18.22

教育

阿拉伯語學習輔助

幫助學習者練習阿拉伯語發音和轉錄