P

Prompt Injection Defender Large V0

由testsavantai開發
TestSavantAI模型是一組專為防禦大型語言模型(LLM)提示注入和越獄攻擊而設計的分類器,微型版基於BERT-tiny架構,平衡安全性與計算效率。
下載量 23
發布時間 : 11/27/2024

模型概述

該模型用於檢測和攔截針對AI系統的惡意提示注入和越獄嘗試,保護語言模型免受濫用。

模型特點

防護效能評分(GES)
創新性綜合指標,結合攻擊成功率(ASR)與誤拒率(FRR)評估模型魯棒性
多尺寸變體
提供從微型到大型的不同規格模型以適應性能與計算效率需求
ONNX支持
提供ONNX運行時版本,優化推理性能

模型能力

惡意提示檢測
越獄攻擊攔截
文本分類
AI安全防護

使用案例

AI安全
ChatGPT防護
檢測並攔截針對ChatGPT的越獄提示
有效降低惡意提示注入成功率
企業AI系統保護
保護企業部署的AI系統免受提示注入攻擊
減少系統濫用風險
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase