R

Reranker Msmarco ModernBERT Base Lambdaloss

由tomaarsen開發
這是一個從ModernBERT-base微調而來的交叉編碼器模型,用於計算文本對的分數,適用於文本重排序和語義搜索任務。
下載量 89
發布時間 : 3/17/2025

模型概述

該模型基於ModernBERT-base架構,使用sentence-transformers庫在msmarco數據集上訓練,專門用於計算文本對的相似度分數,可應用於信息檢索、問答系統等場景。

模型特點

高效文本重排序
能夠快速計算文本對的相似度分數,有效提升檢索系統的排序質量
大序列長度支持
支持最大8192個標記的序列長度,適合處理長文本
高性能指標
在多個評估數據集上表現出色,如NanoMSMARCO_R100上ndcg@10達到0.7251

模型能力

文本相似度計算
信息檢索結果重排序
問答系統答案排序
語義搜索

使用案例

信息檢索
搜索引擎結果重排序
對搜索引擎返回的結果進行二次排序,提高相關文檔的排名
在MSMARCO數據集上map達到0.6768
問答系統
答案相關性排序
對候選答案進行相關性評分,選擇最相關的答案
在NanoNQ_R100數據集上mrr@10達到0.7402
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase