M

Msmarco Portuguese Mt5 Base V1

由doc2query開發
基於mT5的doc2query模型,用於文檔擴展和領域特定訓練數據生成
下載量 44
發布時間 : 4/29/2022

模型概述

該模型基於mT5架構,可為段落生成20-40個查詢,用於文檔擴展或生成嵌入模型的訓練數據。

模型特點

文檔擴展
可為段落生成20-40個查詢,用於增強搜索引擎索引效果
訓練數據生成
可生成(查詢,文本)對用於訓練高性能稠密嵌入模型
多語言支持
基於mT5架構,支持葡萄牙語處理

模型能力

文本生成
查詢生成
文檔擴展

使用案例

信息檢索
搜索引擎增強
將生成的查詢與原始段落共同索引,提高BM25檢索效果
在BEIR論文中驗證了BM25+docT5query作為強大搜索引擎的效果
機器學習訓練
嵌入模型訓練
為未標註文本集生成(查詢,文本)對,用於訓練稠密嵌入模型
GPL論文和SBERT.net上的示例展示了其有效性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase