S

Skywork Critic Llama 3.1 8B

由 Skywork 开发
天工评判系列模型是先进的评判模型,擅长进行成对偏好评估,能够对输入的一对内容进行比较和评估,给出细致的判断。
下载量 1,376
发布时间 : 9/12/2024

模型简介

基于Llama-3.1-70B-Instruct构建的评判模型,专注于成对偏好评估和一般聊天任务,为数据改进、评估和奖励建模等多种应用提供有价值的见解。

模型特点

成对偏好评估
能够精准比较和评估输入对,给出细致的相对质量或适用性判断。
多源数据训练
使用多种高质量数据集进行微调,包括清理后的开源数据、内部人工标注数据、合成评判数据和评判相关聊天数据。
广泛应用价值
为数据改进、评估和奖励建模等多种应用提供有价值的见解。

模型能力

成对内容比较
相对质量评估
适用性判断
一般聊天任务

使用案例

数据改进
数据质量评估
评估和比较不同数据样本的质量,帮助筛选高质量数据。
提升数据集的整体质量
模型评估
模型输出比较
比较不同模型生成的回复,评估其相对质量。
辅助模型选择和优化
奖励建模
强化学习奖励信号
为强化学习模型提供精细的奖励信号。
提升强化学习模型的训练效果
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase