D

Deberta V3 Base Prompt Injection

protectaiによって開発
DeBERTa-v3をファインチューニングしたプロンプトインジェクション検出モデルで、悪意のあるプロンプト入力を識別します
ダウンロード数 35.13k
リリース時間 : 11/25/2023

モデル概要

このモデルはプロンプトインジェクション攻撃を検出するために特別に設計されており、入力テキストを通常のプロンプトまたは悪意のあるインジェクションプロンプトに分類し、AIシステムの安全を保護します。

モデル特徴

高精度検出
評価データセットで99.99%の精度と99.98%のF1値を達成
複数データセット学習
12の異なるソースからのデータセットで学習し、さまざまなプロンプトインジェクションパターンを網羅
マルチフレームワークサポート
ネイティブTransformersとONNXの2つの実行方法を提供
エコシステム統合
LangchainやLLM Guardなどの人気フレームワークとの統合をサポート

モデル能力

テキスト分類
悪意のある入力検出
セキュリティ保護

使用事例

AIセキュリティ
チャットボット保護
悪意のあるユーザーがプロンプトインジェクション攻撃を通じてチャットボットの動作を操作するのを防止
99.7%のインジェクション試行を効果的に識別
APIセキュリティゲートウェイ
APIゲートウェイ層で潜在的な悪意のあるプロンプトを検出し遮断
コンテンツモデレーション
有害コンテンツフィルタリング
コンテンツ制限を回避しようとする悪意のあるプロンプトを識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase