P

Prompt Injection Defender Large V0 Onnx

由testsavantai開發
TestSavantAI模型是一組經過微調的分類器,專門設計用於防禦針對大型語言模型(LLM)的提示注入和越獄攻擊。
下載量 3,225
發布時間 : 11/27/2024

模型概述

該模型採用BERT架構,專注於檢測和攔截惡意提示,保護LLM免受提示注入和越獄攻擊。

模型特點

防護效能評分(GES)
綜合攻擊成功率(ASR)與誤拒率(FRR)的創新評估指標
多尺寸變體
提供不同規格模型以平衡性能與計算效率
ONNX支持
提供ONNX版本,便於部署和優化推理性能

模型能力

惡意提示檢測
越獄攻擊防禦
文本分類

使用案例

AI安全
提示注入防禦
檢測並攔截試圖繞過LLM安全限制的惡意提示
有效降低提示注入攻擊的成功率
越獄攻擊防護
防止用戶通過特殊構造的提示獲取LLM的未授權訪問
減少LLM被濫用的風險
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase