P

Pangolin Guard Base

由dcarpintero開發
基於ModernBERT的輕量級模型,專注於識別惡意提示注入攻擊,提供AI安全防護。
下載量 83
發布時間 : 3/15/2025

模型概述

潘高林防護是一個針對大語言模型(LLM)應用中的提示注入和越獄等安全挑戰設計的防護模型。它能夠識別惡意提示,防止敏感數據洩露或行為偏離預期。

模型特點

輕量級設計
基於ModernBERT的輕量級架構,適合自託管和低成本部署。
開源可用
完全開源,不同於部分未完全開源的現有防護模型。
上下文窗口優化
相比LlamaGuard等僅支持512詞元的模型,提供更優的上下文處理能力。
多場景防護
能夠識別多種類型的提示注入攻擊,包括直接和間接提示注入。

模型能力

惡意提示檢測
提示注入攻擊防禦
AI安全防護
文本分類

使用案例

AI安全
AI代理防護
為AI代理提供提示注入攻擊的防禦機制,防止惡意用戶操縱AI行為。
有效識別並阻止惡意提示,保護AI代理安全運行。
對話界面安全
應用於對話界面,檢測並過濾可能引發越獄或數據洩露的惡意輸入。
提升對話系統的安全性,減少敏感信息洩露風險。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase