P

Prompt Injection Defender Large V0

testsavantaiによって開発
TestSavantAIモデルは、大規模言語モデル(LLM)に対するプロンプトインジェクションやジェイルブレイク攻撃を防御するために設計された分類器群で、ミニ版はBERT-tinyアーキテクチャを基に、セキュリティと計算効率のバランスを取っています。
ダウンロード数 23
リリース時間 : 11/27/2024

モデル概要

このモデルは、AIシステムに対する悪意のあるプロンプトインジェクションやジェイルブレイクの試みを検出・遮断し、言語モデルの悪用を防ぎます。

モデル特徴

防御効果スコア(GES)
攻撃成功率(ASR)と誤拒否率(FRR)を組み合わせた革新的な総合指標で、モデルの堅牢性を評価
マルチサイズバリアント
性能と計算効率のニーズに応じて、ミニ版から大型版まで様々なサイズのモデルを提供
ONNXサポート
ONNXランタイム版を提供し、推論性能を最適化

モデル能力

悪意のあるプロンプト検出
ジェイルブレイク攻撃遮断
テキスト分類
AIセキュリティ保護

使用事例

AIセキュリティ
ChatGPT保護
ChatGPTを対象としたジェイルブレイクプロンプトを検出・遮断
悪意のあるプロンプトインジェクションの成功率を効果的に低減
企業AIシステム保護
企業が導入したAIシステムをプロンプトインジェクション攻撃から保護
システム悪用リスクを低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase