prompt - saturation - attack - detectorオープンソースモデル

Home

Prompt Saturation Attack Detector

Developed by GuardrailsAI

飽和型ジェイルブレイク攻撃を検出するための小型BERTモデルで、他のタイプのジェイルブレイク攻撃に対する独立した防御には適していません。

テキスト分類

Transformers

English#飽和攻撃検出 #BERTファインチューニング #セキュリティ保護

Downloads 4,762

Release Time : 11/7/2024

Model Overview

このモデルはBERTアーキテクチャに基づく小型のプリフィルターで、特定の飽和攻撃を検出するために特別に設計されており、機械学習システムの悪用防止ソリューションの一部として機能します。

Model Features

飽和攻撃検出に特化

飽和型ジェイルブレイク攻撃に特化して設計され、対象的な検出能力を備えています

軽量モデル

bert-tinyアーキテクチャに基づき、計算リソースの要求が低い

セキュリティ保護コンポーネント

完全なセキュリティ保護ソリューションにおけるプリフィルターコンポーネントとして機能

Model Capabilities

ジェイルブレイク攻撃検出

テキスト分類

セキュリティ脅威識別

Use Cases

AIセキュリティ保護

大規模言語モデルのセキュリティ保護

大規模言語モデルシステムの前置きセキュリティフィルターとして

特定のタイプのジェイルブレイク攻撃の試みを識別可能

AIシステムのセキュリティ監査

システムが飽和攻撃を受けているかどうかを検出するために使用

予備的な攻撃検出結果を提供

属性	详情
開発者	Guardrails AI, Joseph Catrambone
資金提供元 (任意)	Guardrails AI
モデルタイプ	Transformer, BERT
言語 (NLP)	英語
ライセンス	制限付き
ファインチューニング元のモデル (任意)	bert-tiny

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers Supports Multiple Languages

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Prompt Saturation Attack Detector

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 モデルIDのモデルカード

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

モデルの詳細

モデルの説明

モデルのソース (任意)

用途

想定外の使用

📄 ライセンス