P

Prompt Injection Defender Large V0 Onnx

testsavantaiによって開発
TestSavantAIモデルは、大規模言語モデル(LLM)に対するプロンプトインジェクションやジェイルブレイク攻撃を防御するために特別に設計された微調整済み分類器のセットです。
ダウンロード数 3,225
リリース時間 : 11/27/2024

モデル概要

このモデルはBERTアーキテクチャを採用し、悪意のあるプロンプトの検出と遮断に特化しており、LLMをプロンプトインジェクションやジェイルブレイク攻撃から保護します。

モデル特徴

防御効果スコア(GES)
攻撃成功率(ASR)と誤拒否率(FRR)を統合した革新的な評価指標
マルチサイズバリアント
性能と計算効率のバランスを取るため、さまざまなサイズのモデルを提供
ONNXサポート
ONNXバージョンを提供し、展開と推論性能の最適化を容易に

モデル能力

悪意のあるプロンプト検出
ジェイルブレイク攻撃防御
テキスト分類

使用事例

AIセキュリティ
プロンプトインジェクション防御
LLMのセキュリティ制限を回避しようとする悪意のあるプロンプトを検出・遮断
プロンプトインジェクション攻撃の成功率を効果的に低減
ジェイルブレイク攻撃保護
特別に構築されたプロンプトを通じてLLMへの不正アクセスを防止
LLMの悪用リスクを低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase