H

Hamsa V0.1 Beta

由nadsoft開發
Hamsa是基於Whisper模型構建的阿拉伯語語音識別模型,專注於中東和北非地區的語言需求。
下載量 46
發布時間 : 10/20/2023

模型概述

Hamsa(همسة)是一個預訓練的阿拉伯語自動語音識別(ASR)模型,致力於解決阿拉伯語獨特的語言細微差異,特別適合中東和北非地區使用。

模型特點

阿拉伯語優化
專門針對阿拉伯語進行優化,解決中東和北非地區特有的語言細微差異。
多數據源訓練
結合多個阿拉伯語語音數據集進行訓練,包括nadsoft/Jordan-Audio、google/fleurs和common_voice_11_0。
技術先進
採用Whisper模型架構,使用Adam優化器和混合精度訓練等先進技術。

模型能力

阿拉伯語語音識別
標準阿拉伯語轉錄
語音轉文本

使用案例

語音轉錄
標準阿拉伯語轉錄
將標準阿拉伯語語音轉換為文本
詞錯誤率(WER)為18.22
教育
阿拉伯語學習輔助
幫助學習者練習阿拉伯語發音和轉錄
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase