L

Llama Prompt Guard 2 22M

meta-llamaによって開発
Llama Prompt Guard 2 86Mは、プロンプトインジェクションやジェイルブレイク攻撃を検出するためのテキスト分類モデルで、Prompt Guardシリーズの第2世代製品です。
ダウンロード数 2,376
リリース時間 : 4/28/2025

モデル概要

このモデルは、LLMを対象としたプロンプト攻撃(プロンプトインジェクションやジェイルブレイク攻撃など)を検出・防止するために開発されました。悪意のあるプロンプトを識別し、LLMアプリケーションを攻撃から保護します。

モデル特徴

性能向上
第1世代モデルと比較して性能が大幅に向上し、分布外データでの誤検知が減少しました。
敵対的攻撃への耐性
スペース操作や断片化分かち書きなどの敵対的分かち書き攻撃を軽減するため、分かち書き戦略を改善しました。
多言語サポート
英語だけでなく、非英語を含む複数言語のプロンプト攻撃を検出可能です。
分類の簡素化
プロンプトを「良性」または「悪意あり」と二値分類するため、使用プロセスが簡素化されています。

モデル能力

悪意のあるプロンプト検出
多言語テキスト分類
プロンプト攻撃防御

使用事例

LLMセキュリティ
プロンプトインジェクション防止
LLMに意図しない命令を実行させようとする悪意のあるプロンプトを検出・ブロックします。
既知および未知のプロンプトインジェクションパターンを効果的に識別
ジェイルブレイク攻撃防止
LLMの組み込みセキュリティ制限を回避しようとする悪意のある命令を識別します。
様々なジェイルブレイク技術を高精度で検出
AIアプリケーションセキュリティ
API保護
LLM APIのフロントエンドに配置し、悪意のあるリクエストをフィルタリングします。
APIの悪用とセキュリティインシデントの減少
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase