D

Deberta V3 Base Prompt Injection V2

protectaiによって開発
DeBERTa-v3-baseをファインチューニングしたプロンプトインジェクション検出モデルで、言語モデルを操作する可能性のある悪意のあるプロンプトを識別します
ダウンロード数 229.97k
リリース時間 : 4/20/2024

モデル概要

このモデルは、言語モデルを操作して予期しない出力を生成させる可能性のあるプロンプトインジェクション攻撃を検出・分類するために特別に設計されており、言語モデルアプリケーションの安全性を強化します

モデル特徴

高精度検出
独立したテストセットで95.25%の精度と99.74%の再現率を達成
複数データセットでの学習
公開されている複数のデータセットを統合し、幅広いプロンプトバリエーションをカバー
英語プロンプトに特化
英語のプロンプトインジェクション検出能力を特別に最適化
コミュニティ主導の改善
コミュニティのフィードバックに基づいてモデル性能を継続的に最適化

モデル能力

プロンプトインジェクション検出
テキスト分類
セキュリティ保護

使用事例

大規模言語モデルセキュリティ
チャットボット保護
チャットボットの出力を操作しようとする悪意のあるプロンプトを検出してブロック
有害なコンテンツ生成を効果的に防止
APIセキュリティゲートウェイ
APIゲートウェイに統合して悪意のあるプロンプトリクエストをフィルタリング
言語モデルAPIの安全性を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase