M

Modernbert Base ColBERT

由Y-J-Ju開發
這是一個從answerdotai/ModernBERT-base在MS-MARCO數據集上微調的PyLate模型,用於句子相似度計算和文檔檢索。
下載量 88
發布時間 : 1/3/2025

模型概述

該模型將句子和段落映射為128維密集向量序列,使用MaxSim算子進行語義文本相似度計算,適用於信息檢索和重排序任務。

模型特點

高效檢索
利用Voyager HNSW索引實現快速文檔檢索
多向量表示
生成128維密集向量序列而非單一向量,保留更多語義信息
蒸餾訓練
使用蒸餾損失函數進行訓練,提升模型性能

模型能力

語義相似度計算
文檔檢索
查詢重排序
特徵提取

使用案例

信息檢索
文檔搜索
在文檔集合中檢索與查詢最相關的文檔
在MS-MARCO等標準檢索數據集上表現良好
搜索結果重排序
對初步檢索結果進行精細化排序
可提升檢索系統的準確率和相關性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase