A

Araeurobert 610M

由Omartificial-Intelligence-Space開發
基於EuroBERT-610m微調的阿拉伯語語義文本嵌入模型,支持1152維稠密向量空間和8192標記的最大序列長度。
下載量 160
發布時間 : 3/19/2025

模型概述

專為阿拉伯語優化的語義文本嵌入模型,適用於語義相似度計算、語義搜索、文本分類等任務。

模型特點

阿拉伯語優化
針對阿拉伯語文本進行了專業微調,顯著提升阿拉伯語義任務性能
長文本支持
支持最大8192標記的序列長度,適合處理長文本
嵌套嵌入
支持1152/960/768/512維度的套娃式嵌入,可根據需求調整維度
高性能
在STS17和STS22.v2基準測試中表現優於標準EuroBERT模型

模型能力

語義文本相似度計算
語義搜索
複述挖掘
文本分類
文本聚類

使用案例

信息檢索
阿拉伯語語義搜索
構建阿拉伯語搜索引擎,理解查詢與文檔的語義相似度
提升搜索結果的相關性
文本分析
阿拉伯語文本分類
對阿拉伯語新聞、評論等進行自動分類
準確率優於傳統方法
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase