G

Granite Guardian 3.2 5b

由 ibm-granite 开发
花岗岩守护者3.2是基于3.1版本精简的风险检测模型,通过迭代剪枝技术实现更高效推理,专注于识别提示与响应中的多维度风险。
下载量 799
发布时间 : 1/23/2025

模型简介

该模型专为检测AI交互中的各类风险设计,包括内容安全、RAG幻觉和智能体工作流风险,支持IBM AI风险图谱定义的多维度评估。

模型特点

迭代剪枝技术
通过移除30%原始参数保持性能同时提升推理速度
多维度风险检测
支持危害内容、RAG幻觉和智能体工作流风险的全面评估
标准化风险评估
采用IBM AI风险图谱定义的标准评估框架

模型能力

内容安全检测
RAG流程评估
智能体函数调用验证
多轮对话风险分析

使用案例

内容安全
有害内容过滤
检测用户输入或模型输出中的暴力、歧视等有害内容
在Aegis安全测试集达到0.88 F1分数
RAG质量保障
事实依据性验证
评估生成内容与检索上下文的一致性
在TRUE基准测试中平均AUC达0.84
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase