S

Skywork Critic Llama 3.1 70B

由 Skywork 开发
天工评判系列模型由天工AI对齐团队开发,包含70B和8B两款先进的评判模型,擅长进行成对偏好评估,能够对输入的文本对进行细致比较,判断其相对质量或适用性。
下载量 1,413
发布时间 : 9/19/2024

模型简介

天工评判系列模型基于Meta的Llama-3.1系列模型进行微调,专注于成对偏好评估和一般聊天任务,在数据改进、评估和奖励建模等应用场景中具有重要价值。

模型特点

成对偏好评估
能够对输入的文本对进行细致比较,判断其相对质量或适用性。
多场景应用
可用于数据改进、评估和奖励建模等多种应用场景。
高性能表现
在RewardBench排行榜上取得了优异的成绩,70B版本在所有规模的生成模型中排名第一。

模型能力

文本对质量评估
偏好数据选择
指令-响应对评分
多维度评判分析

使用案例

数据改进
DPO训练数据选择
用于区分直接偏好优化(DPO)训练中的选择和拒绝的训练数据。
提高模型训练数据的质量
模型评估
响应质量评估
对AI助手的响应进行多维度评分和分析。
提供详细的评估报告和改进建议
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase