P

Prometheus 13b V1.0

由prometheus-eval開發
普羅米修斯是基於Llama-2-Chat微調的評估型語言模型,擅長根據定製標準評估文本質量,可作為GPT-4評估的經濟替代方案。
下載量 1,726
發布時間 : 10/12/2023

模型概述

該模型經過10萬條反饋數據微調,能根據參考答案和評分標準對文本回答進行細粒度評估,性能接近GPT-4。同時可作為RLHF的獎勵模型。

模型特點

細粒度評估能力
通過參考答案和定製評分標準實現比通用模型更精確的文本評估
經濟高效替代方案
評估性能超越GPT-3.5-Turbo,與GPT-4持平但成本更低
多標準適應性
支持兒童可讀性、文化敏感性、創造力等定製化評估標準

模型能力

文本質量評估
反饋生成
獎勵建模
多維度評分

使用案例

模型評估
大語言模型輸出評估
根據特定標準評估不同LLM生成文本的質量
在多項基準測試中與GPT-4評估結果高度一致
強化學習
RLHF獎勵模型
為人類反饋強化學習提供自動化的獎勵信號
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase