M

Marbertv2 Arabic Written Dialect Classifier

由IbrahimAmin開發
基於MARBERTv2微調的阿拉伯語方言分類器,可識別五種主要阿拉伯書面方言
下載量 113
發布時間 : 5/7/2025

模型概述

該模型用於阿拉伯書面方言分類,能夠從原始文本中識別現代標準阿拉伯語(MSA)和4種地區阿拉伯方言(馬格里布、黎凡特、海灣和埃及方言)。

模型特點

多方言識別
能夠區分五種主要的阿拉伯書面方言區域,包括馬格里布、黎凡特、現代標準阿拉伯語、海灣和埃及方言
大規模訓練數據
使用來自9個不同公開數據集的約850,000+阿拉伯語句子進行訓練
社交媒體優化
特別適用於短阿拉伯文本片段的方言識別,數據來源包括社交媒體、論壇和非正式寫作

模型能力

阿拉伯語方言分類
文本分析
社交媒體內容識別

使用案例

語言研究
方言分佈研究
分析社交媒體上不同阿拉伯方言的地理分佈
自然語言處理
方言感知系統
為不同方言區域用戶提供定製化的NLP服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase