prompt - saturation - attack - detector開源模型 - 免費檢測飽和型越獄攻擊

首頁

Prompt Saturation Attack Detector

由GuardrailsAI開發

用於檢測飽和型越獄攻擊的小型BERT模型，不適用於獨立防禦其他類型的越獄攻擊。

文本分類

Transformers

英語#飽和攻擊檢測 #BERT微調 #安全防護

下載量 4,762

發布時間 : 11/7/2024

模型概述

該模型是一個基於BERT架構的小型預過濾器，專門設計用於檢測部分飽和攻擊，是防禦機器學習系統濫用方案中的一個組成部分。

模型特點

專注飽和攻擊檢測

專門針對飽和型越獄攻擊設計，具有針對性檢測能力

輕量級模型

基於bert-tiny架構，計算資源需求低

安全防護組件

作為完整安全防護方案中的預過濾組件

模型能力

越獄攻擊檢測

文本分類

安全威脅識別

使用案例

AI安全防護

大語言模型安全防護

作為大語言模型系統的前置安全過濾器

可識別特定類型的越獄攻擊嘗試

AI系統安全審計

用於檢測系統是否遭受飽和攻擊

提供初步攻擊檢測結果

屬性	詳情
開發者	Guardrails AI, Joseph Catrambone
資助方	Guardrails AI
模型類型	Transformer, BERT
適用語言（NLP）	英語
許可證	限制性許可證
微調基礎模型	bert-tiny

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Prompt Saturation Attack Detector

模型概述

模型特點

模型能力

使用案例

🚀 越獄檢測小模型

🚀 快速開始

✨ 主要特性

📚 詳細文檔

模型詳情

模型來源

適用範圍

不適用場景