S

Skywork Critic Llama 3.1 8B

Developed by Skywork
天工评判系列模型是先进的评判模型,擅长进行成对偏好评估,能够对输入的一对内容进行比较和评估,给出细致的判断。
Downloads 1,376
Release Time : 9/12/2024

Model Overview

基于Llama-3.1-70B-Instruct构建的评判模型,专注于成对偏好评估和一般聊天任务,为数据改进、评估和奖励建模等多种应用提供有价值的见解。

Model Features

成对偏好评估
能够精准比较和评估输入对,给出细致的相对质量或适用性判断。
多源数据训练
使用多种高质量数据集进行微调,包括清理后的开源数据、内部人工标注数据、合成评判数据和评判相关聊天数据。
广泛应用价值
为数据改进、评估和奖励建模等多种应用提供有价值的见解。

Model Capabilities

成对内容比较
相对质量评估
适用性判断
一般聊天任务

Use Cases

数据改进
数据质量评估
评估和比较不同数据样本的质量,帮助筛选高质量数据。
提升数据集的整体质量
模型评估
模型输出比较
比较不同模型生成的回复,评估其相对质量。
辅助模型选择和优化
奖励建模
强化学习奖励信号
为强化学习模型提供精细的奖励信号。
提升强化学习模型的训练效果
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase