D

Dpr Question Encoder Multiset Base

由facebook開發
基於BERT的密集段落檢索(DPR)問題編碼器,用於開放領域問答研究,在多個QA數據集上訓練
下載量 17.51k
發布時間 : 3/2/2022

模型概述

該模型是DPR工具集中的問題編碼器,用於將自然語言問題編碼為低維向量表示,以便在開放領域問答任務中檢索相關段落。

模型特點

多數據集訓練
在自然問題(NQ)、TriviaQA、網頁問題(WQ)和精選TREC(TREC)四個QA數據集上聯合訓練,具有更強的泛化能力
密集向量表示
將問題和段落編碼為低維連續空間中的密集向量,支持高效的相似度計算和檢索
與FAISS兼容
生成的向量表示可直接用於FAISS等高效相似度搜索庫,實現大規模段落檢索

模型能力

問題向量化表示
語義相似度計算
開放領域問答支持

使用案例

問答系統
開放領域問答
構建能夠回答任意領域問題的系統,先檢索相關段落再生成答案
在NQ數據集上top-100準確率達到86%
知識檢索
從大規模文檔集合中檢索與問題最相關的段落
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase