R

Reranker Msmarco ModernBERT Base Lambdaloss

由 tomaarsen 开发
这是一个从ModernBERT-base微调而来的交叉编码器模型,用于计算文本对的分数,适用于文本重排序和语义搜索任务。
下载量 89
发布时间 : 3/17/2025

模型简介

该模型基于ModernBERT-base架构,使用sentence-transformers库在msmarco数据集上训练,专门用于计算文本对的相似度分数,可应用于信息检索、问答系统等场景。

模型特点

高效文本重排序
能够快速计算文本对的相似度分数,有效提升检索系统的排序质量
大序列长度支持
支持最大8192个标记的序列长度,适合处理长文本
高性能指标
在多个评估数据集上表现出色,如NanoMSMARCO_R100上ndcg@10达到0.7251

模型能力

文本相似度计算
信息检索结果重排序
问答系统答案排序
语义搜索

使用案例

信息检索
搜索引擎结果重排序
对搜索引擎返回的结果进行二次排序,提高相关文档的排名
在MSMARCO数据集上map达到0.6768
问答系统
答案相关性排序
对候选答案进行相关性评分,选择最相关的答案
在NanoNQ_R100数据集上mrr@10达到0.7402
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase