Namaa-ARA-Reranker-V1开源模型 - 精准评估阿拉伯语查询段落相关性

首页

Namaa ARA Reranker V1

由 NAMAA-Space 开发

专为阿拉伯语重排序任务设计的模型，能够精准处理查询与段落的相关性评估。

文本嵌入

Transformers

阿拉伯语开源协议:Apache-2.0 #阿拉伯语RAG #查询-段落相关性评估 #高精度重排序

下载量 56

发布时间 : 11/28/2024

模型简介

该模型通过正例与困难负例的查询-段落组合训练，在识别最相关结果方面表现卓越，输出分数可通过Sigmoid函数转换为[0, 1]区间值，提供清晰可解释的相关性度量。

模型特点

阿拉伯语优化

专为阿拉伯语设计，能够精准处理阿拉伯语查询与段落的相关性评估。

直接相关性评估

与生成向量表示的嵌入模型不同，本重排序器直接评估问题与文档之间的相似度，输出相关性分数。

高精度排序

通过正例与困难负例的查询-段落组合训练，模型在识别最相关结果方面表现卓越。

可解释性

输出分数可通过Sigmoid函数转换为[0, 1]区间值，提供清晰可解释的相关性度量。

模型能力

文本相关性评估

阿拉伯语文本处理

查询-段落匹配

使用案例

信息检索

搜索引擎结果排序

对搜索引擎返回的结果进行重排序，提升最相关结果的排名。

显著提升搜索结果的相关性

问答系统

在问答系统中对候选答案进行排序，选择最相关的答案。

提高问答系统的准确率

推荐系统

内容推荐

根据用户查询对推荐内容进行排序，提升推荐的相关性。

改善用户体验

🚀 引入 ARM-V1 | 阿拉伯语重排模型（版本1）

ARM-V1 是专门为阿拉伯语重排任务设计的模型，能够精准处理查询和段落，直接评估问题与文档之间的相似度并输出相关性得分，在识别最相关结果方面表现出色。

更多信息请参考此博客：ARM | 阿拉伯语重排模型。

✨ 主要特性

专为阿拉伯语重排任务量身定制，能精确处理查询和段落。
与嵌入模型不同，该重排器直接评估问题与文档的相似度，输出相关性得分。
通过正负查询 - 段落对组合进行训练，擅长识别最相关的结果。
输出分数可使用 sigmoid 函数转换到 [0, 1] 范围，提供清晰且可解释的相关性度量。

📚 详细文档

阿拉伯语 RAG 流程

💻 使用示例

基础用法

使用 sentence-transformers 库调用模型：

pip install sentence-transformers

from sentence_transformers import CrossEncoder

# 加载交叉编码器模型

# 定义一个查询和一组具有不同相关性的候选文档
query = "تطبيقات الذكاء الاصطناعي تُستخدم في مختلف المجالات لتحسين الكفاءة."

# 与查询具有不同相关性的候选文档
candidates = [
    "الذكاء الاصطناعي يساهم في تحسين الإنتاجية في الصناعات المختلفة.", # 高度相关
    "نماذج التعلم الآلي يمكنها التعرف على الأنماط في مجموعات البيانات الكبيرة.", # 中度相关
    "الذكاء الاصطناعي يساعد الأطباء في تحليل الصور الطبية بشكل أفضل.", # 有点相关
    "تستخدم الحيوانات التمويه كوسيلة للهروب من الحيوانات المفترسة.", # 不相关
]

# 为每个候选文档创建 (查询, 候选文档) 对
query_candidate_pairs = [(query, candidate) for candidate in candidates]

# 从模型获取相关性得分
scores = model.predict(query_candidate_pairs)

# 将候选文档与其得分组合，并按得分降序排序（得分越高，相关性越高）
ranked_candidates = sorted(zip(candidates, scores), key=lambda x: x[1], reverse=True)

# 输出按与查询相关性排序的候选文档及其得分
print("Ranked candidates based on relevance to the query:")
for i, (candidate, score) in enumerate(ranked_candidates, 1):
    print(f"Rank {i}:")
    print(f"Candidate: {candidate}")
    print(f"Score: {score}\n")

🔧 技术细节

评估

数据集

规模：3000 个样本。
结构：
- 查询：代表用户问题的字符串。
- 候选文档：用于回答查询的候选段落。
- 相关性标签：二进制标签（相关为 1，不相关为 0）。

评估过程

查询分组：对查询进行分组，以评估模型为每个查询正确排序候选文档的能力。
模型预测：每个模型为与查询对应的所有候选文档预测相关性得分。
指标计算：计算指标以衡量模型将相关文档排在不相关文档之上的能力。

模型	MRR	MAP	nDCG@10
cross-encoder/ms - marco - MiniLM - L - 6 - v2	0.631	0.6313	0.725
cross-encoder/ms - marco - MiniLM - L - 12 - v2	0.664	0.664	0.750
BAAI/bge - reranker - v2 - m3	0.902	0.902	0.927
Omartificial - Intelligence - Space/ARA - Reranker - V1	0.934	0.9335	0.951

📄 许可证

本项目采用 Apache 2.0 许可证。

📖 致谢

作者感谢苏丹王子大学在本项目中提供的宝贵支持。他们的贡献和资源对这些模型的开发和微调起到了重要作用。

📚 引用

如果您使用了 ARM-V1 模型，请按以下方式引用：

@misc{nacar2025ARM,
      title={ARM, Arabic Reranker Model}, 
      author={Omer Nacar},
      year={2025},
      url={https://huggingface.co/Omartificial-Intelligence-Space/ARA-Reranker-V1},
}