DialogRPT-human-vs-rand開源對話回應排名模型 - 精準預測回應與上下文相關性

首頁

Dialogrpt Human Vs Rand

由microsoft開發

DialogRPT是一個基於人類反饋數據訓練的對話回應排名模型，用於預測回應與上下文的相關性。

對話系統

Transformers

#對話回應評分 #人類反饋預測 #上下文相關性評估

下載量 1,021

發布時間 : 3/2/2022

模型概述

該模型是DialogRPT系列的一部分，專門用於區分給定上下文中的人類回應與隨機回應，預測回應與上下文對應的可能性。

模型特點

人類反饋數據訓練

基於1億多條人類反饋數據進行訓練，能夠準確預測回應的相關性。

多任務支持

支持多種對話排名任務，包括人類反饋和人類相似度任務。

改進對話生成

可用於改進現有對話生成模型，通過重新排序生成的回應候選。

模型能力

對話回應排名

區分人類與隨機回應

預測回應相關性

使用案例

對話系統

改進對話生成模型

通過重新排序生成的回應候選，提高對話系統的回應質量。

提高回應的相關性和人類偏好評分

對話回應篩選

從多個候選回應中選擇最相關和最有意義的回應。

提升用戶體驗和對話流暢度

🚀 演示項目

本項目提供了一個基於對話排名預訓練變換器（DialogRPT）的演示，用於預測對話回覆的相關性和質量。通過使用大規模的人類反饋數據進行訓練，該模型可以幫助提升現有對話生成模型的性能。

請嘗試這個 📔 Colab Notebook 演示（點擊此處！）

上下文	回覆	`human_vs_rand` 得分
我喜歡自然語言處理！	他是一位偉大的籃球運動員。	0.027
我喜歡自然語言處理！	你能告訴我它是如何工作的嗎？	0.754
我喜歡自然語言處理！	我也是！	0.631

human_vs_rand 得分用於預測回覆與給定上下文的匹配程度，而非隨機回覆的可能性。

📚 DialogRPT-human-vs-rand

對話排名預訓練變換器

一個對話回覆獲得點贊和/或得到回覆的可能性有多大？

這正是 DialogRPT 模型旨在預測的內容。它是由微軟研究院自然語言處理小組提出的一組對話回覆排名模型，基於超過一億條人類反饋數據進行訓練。該模型可用於通過對生成的回覆候選進行重新排序，來改進現有的對話生成模型（例如 DialoGPT）。

快速鏈接：

我們考慮了以下任務並提供了相應的預訓練模型：

任務	描述	預訓練模型
人類反饋	給定一個上下文及其兩個人類回覆，預測...
`updown`	... 哪個獲得更多點贊？	模型卡片
`width`	... 哪個獲得更多直接回復？	模型卡片
`depth`	... 哪個獲得更長的後續對話線程？	模型卡片
類人回覆 (人類 vs 機器)	給定一個上下文和一個人類回覆，將其與...區分開來
`human_vs_rand`	... 一個隨機的人類回覆	本模型
`human_vs_machine`	... 一個機器生成的回覆	模型卡片

📞 聯繫我們

請在我們的倉庫上創建一個問題。

📖 引用

@inproceedings{gao2020dialogrpt,
    title={Dialogue Response RankingTraining with Large-Scale Human Feedback Data},
    author={Xiang Gao and Yizhe Zhang and Michel Galley and Chris Brockett and Bill Dolan},
    year={2020},
    booktitle={EMNLP}
}