R

Rootsignals Judge Llama 70B

由 root-signals 开发
Root Judge是一款强大的中型大语言模型,专为可靠且可定制的LLM系统评估而设计。基于Llama-3.3-70B-Instruct微调,擅长成对偏好判断和带来源引用的多轮指令遵循任务。
下载量 620
发布时间 : 2/5/2025

模型简介

Root Judge是一款专注于大语言模型评估的中型模型,在幻觉检测和指令遵循方面表现优异,支持本地部署和低成本应用。

模型特点

高性能幻觉检测
在RAG设置中检测上下文相关的幻觉,性能超越领先闭源模型
强大的指令遵循能力
在多种基准测试中表现优异,支持复杂的用户定义评分标准
低成本高效部署
FP8权重免费提供,适合研究和商业应用,成本仅为同类模型的一小部分
长上下文支持
可处理长达32k令牌的长输入,并提供详细的结构化理由
本地部署支持
适用于隐私敏感场景,支持在本地环境运行

模型能力

大语言模型评估
幻觉检测
指令遵循评估
偏好判断
结构化输出生成
长上下文处理

使用案例

模型评估
RAG系统幻觉检测
检测检索增强生成系统中的上下文相关幻觉
在HaluBench测试集上达到86.3%通过率
指令遵循评估
评估模型对复杂指令的遵循能力
在IFEval等基准测试中表现优异
内容审核
政治内容识别
识别文本中的政治相关内容和术语
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase