t5-query-reformulation-RL開源模型 - 助力搜索查詢改寫，生成多樣相關表述

首頁

T5 Query Reformulation RL

由prhegde開發

這是一個專為搜索查詢改寫設計的生成模型，採用序列到序列架構和強化學習框架來生成多樣化且相關的查詢改寫。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #搜索查詢改寫 #強化學習優化 #多樣化生成

下載量 366

發布時間 : 4/20/2024

模型概述

該模型通過序列到序列架構生成重新表述的查詢，並利用強化學習框架進一步提升性能。它可以與稀疏檢索方法集成以增強搜索中的文檔召回率。

模型特點

強化學習優化

採用策略梯度算法進行微調，通過獎勵函數優化查詢改寫的多樣性和相關性

多樣化查詢生成

能夠生成多種改寫版本，提高搜索召回率

與稀疏檢索兼容

可與BM25等傳統檢索方法無縫集成

模型能力

文本生成

查詢改寫

搜索優化

使用案例

信息檢索

網頁搜索查詢改寫

將用戶原始查詢改寫成更有效的搜索表達式

提高搜索引擎的文檔召回率

電子商務搜索優化

為產品搜索生成多樣化的查詢變體

提升商品發現率

對話系統

虛擬助手查詢理解

將自然語言問題改寫成更適合檢索的形式

提高問答系統準確性

🚀 搜索查詢重寫生成模型

本模型專為搜索查詢重寫而設計，採用序列到序列架構生成改寫後的查詢。它藉助強化學習框架，結合策略梯度算法進一步提升性能。通過獎勵函數訓練，能對關鍵詞進行釋義，使生成的查詢更多樣化。該模型可與基於BM25的稀疏檢索等方法集成，提高搜索中的文檔召回率。

🚀 快速開始

若要使用此模型，可通過採樣並設置重複懲罰來生成多樣化的樣本。以下是示例代碼：

import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer

MODEL_ID = "prhegde/t5-query-reformulation-RL"

tokenizer = T5Tokenizer.from_pretrained(MODEL_ID)
model = T5ForConditionalGeneration.from_pretrained(MODEL_ID)
model.eval()

input_sequence = "how to bake great cookie"
input_ids = tokenizer(input_sequence, return_tensors="pt").input_ids
print(f'Input: {input_sequence}')

nsent = 4
with torch.no_grad():
    for i in range(nsent):
        output = model.generate(input_ids, max_length=35, num_beams=1, do_sample=True, repetition_penalty=1.8)
        target_sequence = tokenizer.decode(output[0], skip_special_tokens=True)
        print(f'Target: {target_sequence}')

✨ 主要特性

特定用途設計：專為搜索查詢重寫而打造，適用於多種搜索場景，如網頁搜索、電商搜索等。
強化學習優化：運用強化學習框架和策略梯度算法，提升模型生成多樣化且相關查詢的能力。
可集成性：能與稀疏檢索方法集成，提高搜索中的文檔召回率。

📦 安裝指南

文檔未提及具體安裝步驟，可參考模型倉庫中的說明進行安裝。

💻 使用示例

基礎用法

import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer

MODEL_ID = "prhegde/t5-query-reformulation-RL"

tokenizer = T5Tokenizer.from_pretrained(MODEL_ID)
model = T5ForConditionalGeneration.from_pretrained(MODEL_ID)
model.eval()

input_sequence = "how to bake great cookie"
input_ids = tokenizer(input_sequence, return_tensors="pt").input_ids
print(f'Input: {input_sequence}')

nsent = 4
with torch.no_grad():
    for i in range(nsent):
        output = model.generate(input_ids, max_length=35, num_beams=1, do_sample=True, repetition_penalty=1.8)
        target_sequence = tokenizer.decode(output[0], skip_special_tokens=True)
        print(f'Target: {target_sequence}')

高級用法

文檔未提及高級用法相關代碼，可根據實際需求調整模型的生成參數，如max_length、num_beams、do_sample、repetition_penalty等，以獲得不同的生成效果。

📚 詳細文檔

預期用例

搜索查詢重寫：適用於網頁搜索、電商搜索等場景，對查詢進行改寫以提高搜索效果。
虛擬助手和聊天機器人：幫助生成更自然、多樣化的回覆。
信息檢索：提升信息檢索的準確性和召回率。

模型描述

訓練過程

訓練過程從用Google的 T5-base模型初始化序列到序列模型開始。
首先，使用 MS-MARCO查詢對數據集對模型進行有監督訓練。
隨後，使用強化學習（RL）框架對模型進行微調，以增強其生成多樣化且相關查詢的能力。
採用策略梯度方法對模型進行微調。對於給定的輸入查詢，從模型中採樣一組軌跡（改寫後的查詢）並計算獎勵。應用策略梯度算法更新模型。
啟發式地計算獎勵以增強模型的釋義能力。不過，這些獎勵可根據需要用其他特定領域或特定目標的獎勵函數替代。

更多詳細信息請參考此處。

模型來源

倉庫：https://github.com/PraveenSH/RL-Query-Reformulation

🔧 技術細節

該模型採用序列到序列架構，結合強化學習框架和策略梯度算法進行訓練。通過獎勵函數引導模型生成多樣化的查詢，提高搜索中的文檔召回率。訓練過程包括初始化模型、有監督訓練和強化學習微調等步驟。

📄 許可證

本模型採用Apache-2.0許可證。

信息表格

屬性	詳情
模型類型	生成式模型，用於搜索查詢重寫
訓練數據	MS-MARCO查詢對數據集
許可證	Apache-2.0
倉庫地址	https://github.com/PraveenSH/RL-Query-Reformulation