S

Silma Embedding Matryoshka V0.1

由 silma-ai 开发
SILMA阿拉伯套娃嵌入模型0.1是一款先进的阿拉伯文本嵌入模型,采用创新的套娃嵌入技术,可在不同维度上优化文本表示,平衡速度、存储和准确性。
下载量 446
发布时间 : 10/12/2024

模型简介

该模型旨在生成强大且富含上下文信息的文本表示,适用于从语义搜索到文档分类等广泛的应用场景。

模型特点

套娃嵌入技术
可在不同维度上进行优化,平衡速度、存储和准确性,即使极低的维度(如8)也能产生可接受的语义相似度得分。
多语言支持
支持阿拉伯语和英语,适用于跨语言任务。
高性能评估
在多个数据集上进行了全面评估,包括MTEB MassiveIntentClassification、MTEB MassiveScenarioClassification和MTEB STS17等。

模型能力

文本嵌入
句子相似度计算
语义搜索
文档分类

使用案例

语义搜索
短句子相似度
计算短句子之间的语义相似度,如'الطقس اليوم مشمس'与'الجو اليوم كان مشمسًا ورائعًا'。
在768维下相似度为0.479942,256维下为0.509289。
长句子相似度
计算长句子之间的语义相似度,如'الكتاب يتحدث عن أهمية الذكاء الاصطناعي في تطوير المجتمعات الحديثة'与'في هذا الكتاب، يناقش الكاتب كيف يمكن للتكنولوجيا أن تغير العالم'。
在768维下相似度为0.637418,256维下为0.614761。
问答匹配
问题与段落匹配
匹配问题与相关段落,如'ما هي فوائد ممارسة الرياضة؟'与'ممارسة الرياضة بشكل منتظم تساعد على تحسين الصحة العامة واللياقة البدنية'。
在768维下相似度为0.520329,256维下为0.556088。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase