S

Spar Wiki Bm25 Lexmodel Query Encoder

由facebook開發
基於BERT-base架構的密集檢索器,在維基百科文章上訓練,旨在模仿BM25的行為
下載量 80
發布時間 : 9/21/2022

模型概述

該模型是SPAR論文中提出的詞彙模型(Λ)的查詢編碼器部分,通過與上下文編碼器配合使用,可以實現類似稀疏檢索器BM25的效果。模型能夠學習詞彙匹配模式,可與標準密集檢索器結合使用以提升檢索性能。

模型特點

BM25行為模仿
通過訓練模仿傳統BM25稀疏檢索器的行為,保留詞彙匹配優勢
與密集檢索器互補
可與DPR等密集檢索器結合,同時具備詞彙和語義匹配能力
BERT-base架構
基於廣泛使用的BERT-base架構,便於集成到現有系統中

模型能力

文本嵌入生成
詞彙特徵提取
文檔檢索
問答系統支持

使用案例

信息檢索
開放域問答
用於構建問答系統,從大規模文檔中檢索相關答案
結合DPR使用時能同時捕捉詞彙和語義匹配信號
文檔檢索
用於搜索引擎或知識庫中的相關文檔檢索
模仿BM25行為,保留傳統檢索系統的優勢
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase