S

Skywork Critic Llama 3.1 8B

由Skywork開發
天工評判系列模型是先進的評判模型,擅長進行成對偏好評估,能夠對輸入的一對內容進行比較和評估,給出細緻的判斷。
下載量 1,376
發布時間 : 9/12/2024

模型概述

基於Llama-3.1-70B-Instruct構建的評判模型,專注於成對偏好評估和一般聊天任務,為數據改進、評估和獎勵建模等多種應用提供有價值的見解。

模型特點

成對偏好評估
能夠精準比較和評估輸入對,給出細緻的相對質量或適用性判斷。
多源數據訓練
使用多種高質量數據集進行微調,包括清理後的開源數據、內部人工標註數據、合成評判數據和評判相關聊天數據。
廣泛應用價值
為數據改進、評估和獎勵建模等多種應用提供有價值的見解。

模型能力

成對內容比較
相對質量評估
適用性判斷
一般聊天任務

使用案例

數據改進
數據質量評估
評估和比較不同數據樣本的質量,幫助篩選高質量數據。
提升數據集的整體質量
模型評估
模型輸出比較
比較不同模型生成的回覆,評估其相對質量。
輔助模型選擇和優化
獎勵建模
強化學習獎勵信號
為強化學習模型提供精細的獎勵信號。
提升強化學習模型的訓練效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase