G

Granite Guardian 3.2 5b

由ibm-granite開發
花崗岩守護者3.2是基於3.1版本精簡的風險檢測模型,通過迭代剪枝技術實現更高效推理,專注於識別提示與響應中的多維度風險。
下載量 799
發布時間 : 1/23/2025

模型概述

該模型專為檢測AI交互中的各類風險設計,包括內容安全、RAG幻覺和智能體工作流風險,支持IBM AI風險圖譜定義的多維度評估。

模型特點

迭代剪枝技術
通過移除30%原始參數保持性能同時提升推理速度
多維度風險檢測
支持危害內容、RAG幻覺和智能體工作流風險的全面評估
標準化風險評估
採用IBM AI風險圖譜定義的標準評估框架

模型能力

內容安全檢測
RAG流程評估
智能體函數調用驗證
多輪對話風險分析

使用案例

內容安全
有害內容過濾
檢測用戶輸入或模型輸出中的暴力、歧視等有害內容
在Aegis安全測試集達到0.88 F1分數
RAG質量保障
事實依據性驗證
評估生成內容與檢索上下文的一致性
在TRUE基準測試中平均AUC達0.84
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase