S

Skywork Critic Llama 3.1 70B

由Skywork開發
天工評判系列模型由天工AI對齊團隊開發,包含70B和8B兩款先進的評判模型,擅長進行成對偏好評估,能夠對輸入的文本對進行細緻比較,判斷其相對質量或適用性。
下載量 1,413
發布時間 : 9/19/2024

模型概述

天工評判系列模型基於Meta的Llama-3.1系列模型進行微調,專注於成對偏好評估和一般聊天任務,在數據改進、評估和獎勵建模等應用場景中具有重要價值。

模型特點

成對偏好評估
能夠對輸入的文本對進行細緻比較,判斷其相對質量或適用性。
多場景應用
可用於數據改進、評估和獎勵建模等多種應用場景。
高性能表現
在RewardBench排行榜上取得了優異的成績,70B版本在所有規模的生成模型中排名第一。

模型能力

文本對質量評估
偏好數據選擇
指令-響應對評分
多維度評判分析

使用案例

數據改進
DPO訓練數據選擇
用於區分直接偏好優化(DPO)訓練中的選擇和拒絕的訓練數據。
提高模型訓練數據的質量
模型評估
響應質量評估
對AI助手的響應進行多維度評分和分析。
提供詳細的評估報告和改進建議
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase