P

Pangolin Guard Large

由dcarpintero開發
基於ModernBERT(大模型版)的輕量級模型,專用於識別惡意提示(即提示注入攻擊)。
下載量 72
發布時間 : 3/11/2025

模型概述

巨蜥守衛是一個專為識別和防禦大語言模型(LLM)應用中的提示注入和越獄等安全挑戰而設計的輕量級模型。它能夠有效防止敏感數據洩露或模型行為偏離預期。

模型特點

輕量級設計
模型設計輕量,適合自託管和低成本部署。
高準確率
在專項基準測試中表現出高準確率和F1分數,有效識別惡意提示。
開源
完全開源,便於社區使用和改進。
低過度防禦傾向
通過NotInject測試,衡量防護模型的過度防禦傾向,確保良性輸入不被誤判。

模型能力

識別惡意提示
防禦提示注入攻擊
檢測越獄攻擊
保護敏感數據

使用案例

AI代理和對話界面
自託管防禦機制
為AI代理和對話界面添加自託管、低成本的提示注入攻擊防禦機制。
有效防止敏感數據洩露和模型行為偏離預期。
安全防護
隱私侵犯嘗試檢測
評估隱私侵犯嘗試和通過間接提示注入攻擊提出的邊界試探性查詢。
高準確率識別惡意行為。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase