M

Msmarco T5 Base V1

由doc2query開發
基於T5的doc2query模型,用於文檔擴展和訓練數據生成
下載量 112
發布時間 : 3/2/2022

模型概述

該模型基於T5架構,主要用於文檔擴展和領域專用訓練數據生成。它能夠為輸入文本生成多個相關查詢,提升檢索系統的性能。

模型特點

文檔擴展
可為段落生成20-40個查詢,將段落與生成查詢共同索引,提升檢索效果
訓練數據生成
可用於生成嵌入模型的訓練數據,為未標註文本生成(查詢,文本)對
語義鴻溝彌補
通過生成查詢包含同義詞,彌補詞彙檢索的語義鴻溝

模型能力

文本生成
查詢生成
文檔擴展

使用案例

信息檢索
搜索引擎優化
將生成查詢與原始文檔共同索引,提升BM25檢索效果
在BEIR基準測試中驗證了其作為強大搜索引擎的效果
機器學習
訓練數據生成
為未標註文本生成(查詢,文本)對,用於訓練稠密嵌入模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase