A

Araeurobert 2.1B

由Omartificial-Intelligence-Space開發
基於EuroBERT-2.1B微調的阿拉伯語語義嵌入模型,支持2304維稠密向量空間和最長8192個標記的輸入。
下載量 45
發布時間 : 3/20/2025

模型概述

專為阿拉伯語優化的語義文本嵌入模型,適用於語義相似度計算、語義搜索、文本分類等多種NLP任務。

模型特點

高維語義嵌入
支持2304維稠密向量空間,可捕捉豐富的語義信息
長文本支持
最大支持8192個標記的輸入,適合處理長文本
嵌套維度選擇
支持2304、1152、960、580四種維度選擇,平衡性能與計算效率
阿拉伯語優化
專門針對阿拉伯語進行優化,在STS17基準測試中獲得79分

模型能力

語義文本相似度計算
語義搜索
複述挖掘
文本分類
聚類分析

使用案例

信息檢索
阿拉伯語文檔相似度搜索
在阿拉伯語文檔庫中查找語義相似的文檔
高準確率的語義匹配
內容分析
阿拉伯語文本聚類
對阿拉伯語新聞或社交媒體內容進行主題聚類
有效的主題識別和分組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase