G

Gpt2 Open Instruct V1 Anthropic Hh Rlhf

由jtatman開發
基於GPT2-open-instruct在Anthropic/hh-rlhf數據集上微調的對話模型,擅長響應對話場景中的提示
下載量 125
發布時間 : 7/22/2023

模型概述

該模型是基於vicgalle/gpt2-open-instruct-v1在Anthropic/hh-rlhf數據集子集上微調的版本,主要用於對話場景中的指令響應

模型特點

對話場景優化
專門針對'Human:'和'Assistant:'對話格式進行優化
短文本生成優勢
在短文本回復場景中表現更佳
RLHF適配
通過部分RLHF適配器重構了語言模型頭部

模型能力

對話生成
指令響應
短文本生成

使用案例

對話系統
對話響應生成
根據用戶輸入生成對話響應
在評估集上取得2.1534的損失值
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase