R

Reranker Gte Multilingual Base Msmarco Bce Ep 2

Developed by skfrost19
基于sentence-transformers库在msmarco数据集上训练的交叉编码器模型,用于文本重排序和语义搜索
Downloads 28
Release Time : 4/6/2025

Model Overview

该模型计算文本对的分数,可用于文本重排序和语义搜索任务。它是在199万条训练样本上使用二元交叉熵损失函数训练得到的。

Model Features

高性能重排序
在NanoMSMARCO_R100数据集上达到0.7008的NDCG@10分数,表现优异
大规模训练
使用199万条训练样本进行训练,具有强大的语义理解能力
长文本支持
最大支持8192个标记的序列长度,适合处理长文本

Model Capabilities

文本对评分
语义搜索
搜索结果重排序

Use Cases

信息检索
搜索引擎结果重排序
对搜索引擎返回的结果进行重新排序,提升相关性
在MSMARCO数据集上NDCG@10达到0.7008
问答系统
答案相关性排序
对候选答案进行相关性排序,选择最佳答案
在NanoNQ_R100数据集上NDCG@10达到0.6888
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase