L

Llama Prompt Guard 2 22M

Developed by meta-llama
Llama Prompt Guard 2 86Mは、プロンプトインジェクションやジェイルブレイク攻撃を検出するためのテキスト分類モデルで、Prompt Guardシリーズの第2世代製品です。
Downloads 2,376
Release Time : 4/28/2025

Model Overview

このモデルは、LLMを対象としたプロンプト攻撃(プロンプトインジェクションやジェイルブレイク攻撃など)を検出・防止するために開発されました。悪意のあるプロンプトを識別し、LLMアプリケーションを攻撃から保護します。

Model Features

性能向上
第1世代モデルと比較して性能が大幅に向上し、分布外データでの誤検知が減少しました。
敵対的攻撃への耐性
スペース操作や断片化分かち書きなどの敵対的分かち書き攻撃を軽減するため、分かち書き戦略を改善しました。
多言語サポート
英語だけでなく、非英語を含む複数言語のプロンプト攻撃を検出可能です。
分類の簡素化
プロンプトを「良性」または「悪意あり」と二値分類するため、使用プロセスが簡素化されています。

Model Capabilities

悪意のあるプロンプト検出
多言語テキスト分類
プロンプト攻撃防御

Use Cases

LLMセキュリティ
プロンプトインジェクション防止
LLMに意図しない命令を実行させようとする悪意のあるプロンプトを検出・ブロックします。
既知および未知のプロンプトインジェクションパターンを効果的に識別
ジェイルブレイク攻撃防止
LLMの組み込みセキュリティ制限を回避しようとする悪意のある命令を識別します。
様々なジェイルブレイク技術を高精度で検出
AIアプリケーションセキュリティ
API保護
LLM APIのフロントエンドに配置し、悪意のあるリクエストをフィルタリングします。
APIの悪用とセキュリティインシデントの減少
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase