L

Llama Prompt Guard 2 22M

由meta-llama開發
Llama Prompt Guard 2 86M是一個用於檢測提示注入和越獄攻擊的文本分類模型,是Prompt Guard系列的第二代產品。
下載量 2,376
發布時間 : 4/28/2025

模型概述

該模型旨在幫助開發者檢測和防止針對LLM的提示攻擊,包括提示注入和越獄攻擊。它能夠識別惡意提示並保護LLM應用免受攻擊。

模型特點

改進的性能
相比第一代模型,性能顯著提升,減少了在分佈外數據上的誤報。
抗對抗攻擊
改進了分詞策略以減輕對抗性分詞攻擊,如空格操縱和碎片化分詞。
多語言支持
能夠檢測多種語言的提示攻擊,包括英語和非英語。
簡化分類
專注於二元分類,將提示標記為'良性'或'惡意',簡化了使用流程。

模型能力

惡意提示檢測
多語言文本分類
提示攻擊防護

使用案例

LLM安全
防止提示注入
檢測並阻止試圖操縱LLM執行非預期指令的惡意提示。
有效識別已知和未知的提示注入模式
防止越獄攻擊
識別試圖繞過LLM內置安全限制的惡意指令。
高準確率檢測各種越獄技術
AI應用安全
API防護
在LLM API前端部署,過濾惡意請求。
減少API濫用和安全事件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase