L

Llama 3 OffsetBias RM 8B

由NCSOFT開發
基於OffsetBias數據集訓練的獎勵模型,針對評估模型中的偏差具有更強魯棒性
下載量 1,782
發布時間 : 7/11/2024

模型概述

該模型是一個基於Llama-3架構的獎勵模型,專門設計用於減少評估模型時常見的各種偏差。通過融合多個高質量數據集訓練而成,特別適用於需要公平評估的場景。

模型特點

偏差魯棒性
專門針對評估模型中常見的各種偏差進行優化,提供更公平的評分
多數據集融合
結合了UltraFeedback、HelpSteer等多個高質量數據集進行訓練
模型融合技術
通過中間模型與基礎獎勵模型的融合獲得最終模型

模型能力

文本質量評估
對話響應評分
安全性評估
推理能力評估

使用案例

AI對話評估
聊天機器人響應評分
評估聊天機器人回覆的質量和相關性
在RewardBench聊天評估中獲得97.21分
內容安全評估
有害內容檢測
識別和評分潛在有害或不適當的內容
在RewardBench安全性評估中獲得89.01分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase