P

Prompt Saturation Attack Detector

由GuardrailsAI開發
用於檢測飽和型越獄攻擊的小型BERT模型,不適用於獨立防禦其他類型的越獄攻擊。
下載量 4,762
發布時間 : 11/7/2024

模型概述

該模型是一個基於BERT架構的小型預過濾器,專門設計用於檢測部分飽和攻擊,是防禦機器學習系統濫用方案中的一個組成部分。

模型特點

專注飽和攻擊檢測
專門針對飽和型越獄攻擊設計,具有針對性檢測能力
輕量級模型
基於bert-tiny架構,計算資源需求低
安全防護組件
作為完整安全防護方案中的預過濾組件

模型能力

越獄攻擊檢測
文本分類
安全威脅識別

使用案例

AI安全防護
大語言模型安全防護
作為大語言模型系統的前置安全過濾器
可識別特定類型的越獄攻擊嘗試
AI系統安全審計
用於檢測系統是否遭受飽和攻擊
提供初步攻擊檢測結果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase