S

SA BERT V1

由Omartificial-Intelligence-Space開發
SA-BERT-V1是基於MARBERTv2微調的沙特方言嵌入模型,專為處理沙特阿拉伯方言設計,提供高質量的句子嵌入。
下載量 31
發布時間 : 5/12/2025

模型概述

SA-BERT-V1是一個針對沙特阿拉伯方言優化的句子嵌入模型,基於UBC-NLP/MARBERTv2預訓練模型微調,適用於語義相似度、聚類、檢索和分類任務。

模型特點

沙特方言優化
專門針對沙特阿拉伯方言進行微調,提升了方言理解和處理能力。
高性能嵌入
在內部與跨類別相似度差距上提升了+0.0022,44個專業類別中平均餘弦分數達到0.98。
多樣數據訓練
使用超過50萬條沙特方言句子進行微調,涵蓋多樣主題和地區變體。

模型能力

語義相似度計算
文本聚類
信息檢索
下游分類任務

使用案例

自然語言處理
沙特方言語義相似度分析
用於計算沙特方言句子之間的語義相似度。
在測試集上達到0.98的平均餘弦相似度。
沙特方言文本聚類
對沙特方言文本進行聚類分析。
在沙特方言聚類任務中表現優異。
信息檢索
沙特方言文檔檢索
用於構建沙特方言的文檔檢索系統。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase