G

Granite Guardian 3.2 5b

Developed by ibm-granite
花岗岩守护者3.2是基于3.1版本精简的风险检测模型,通过迭代剪枝技术实现更高效推理,专注于识别提示与响应中的多维度风险。
Downloads 799
Release Time : 1/23/2025

Model Overview

该模型专为检测AI交互中的各类风险设计,包括内容安全、RAG幻觉和智能体工作流风险,支持IBM AI风险图谱定义的多维度评估。

Model Features

迭代剪枝技术
通过移除30%原始参数保持性能同时提升推理速度
多维度风险检测
支持危害内容、RAG幻觉和智能体工作流风险的全面评估
标准化风险评估
采用IBM AI风险图谱定义的标准评估框架

Model Capabilities

内容安全检测
RAG流程评估
智能体函数调用验证
多轮对话风险分析

Use Cases

内容安全
有害内容过滤
检测用户输入或模型输出中的暴力、歧视等有害内容
在Aegis安全测试集达到0.88 F1分数
RAG质量保障
事实依据性验证
评估生成内容与检索上下文的一致性
在TRUE基准测试中平均AUC达0.84
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase