D

Deberta V3 Base Prompt Injection

Developed by protectai
DeBERTa-v3をファインチューニングしたプロンプトインジェクション検出モデルで、悪意のあるプロンプト入力を識別します
Downloads 35.13k
Release Time : 11/25/2023

Model Overview

このモデルはプロンプトインジェクション攻撃を検出するために特別に設計されており、入力テキストを通常のプロンプトまたは悪意のあるインジェクションプロンプトに分類し、AIシステムの安全を保護します。

Model Features

高精度検出
評価データセットで99.99%の精度と99.98%のF1値を達成
複数データセット学習
12の異なるソースからのデータセットで学習し、さまざまなプロンプトインジェクションパターンを網羅
マルチフレームワークサポート
ネイティブTransformersとONNXの2つの実行方法を提供
エコシステム統合
LangchainやLLM Guardなどの人気フレームワークとの統合をサポート

Model Capabilities

テキスト分類
悪意のある入力検出
セキュリティ保護

Use Cases

AIセキュリティ
チャットボット保護
悪意のあるユーザーがプロンプトインジェクション攻撃を通じてチャットボットの動作を操作するのを防止
99.7%のインジェクション試行を効果的に識別
APIセキュリティゲートウェイ
APIゲートウェイ層で潜在的な悪意のあるプロンプトを検出し遮断
コンテンツモデレーション
有害コンテンツフィルタリング
コンテンツ制限を回避しようとする悪意のあるプロンプトを識別
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase