S

Silma Embedding Matryoshka V0.1

由silma-ai開發
SILMA阿拉伯套娃嵌入模型0.1是一款先進的阿拉伯文本嵌入模型,採用創新的套娃嵌入技術,可在不同維度上優化文本表示,平衡速度、存儲和準確性。
下載量 446
發布時間 : 10/12/2024

模型概述

該模型旨在生成強大且富含上下文信息的文本表示,適用於從語義搜索到文檔分類等廣泛的應用場景。

模型特點

套娃嵌入技術
可在不同維度上進行優化,平衡速度、存儲和準確性,即使極低的維度(如8)也能產生可接受的語義相似度得分。
多語言支持
支持阿拉伯語和英語,適用於跨語言任務。
高性能評估
在多個數據集上進行了全面評估,包括MTEB MassiveIntentClassification、MTEB MassiveScenarioClassification和MTEB STS17等。

模型能力

文本嵌入
句子相似度計算
語義搜索
文檔分類

使用案例

語義搜索
短句子相似度
計算短句子之間的語義相似度,如'الطقس اليوم مشمس'與'الجو اليوم كان مشمسًا ورائعًا'。
在768維下相似度為0.479942,256維下為0.509289。
長句子相似度
計算長句子之間的語義相似度,如'الكتاب يتحدث عن أهمية الذكاء الاصطناعي في تطوير المجتمعات الحديثة'與'في هذا الكتاب، يناقش الكاتب كيف يمكن للتكنولوجيا أن تغير العالم'。
在768維下相似度為0.637418,256維下為0.614761。
問答匹配
問題與段落匹配
匹配問題與相關段落,如'ما هي فوائد ممارسة الرياضة؟'與'ممارسة الرياضة بشكل منتظم تساعد على تحسين الصحة العامة واللياقة البدنية'。
在768維下相似度為0.520329,256維下為0.556088。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase