D

Deberta V3 Base Prompt Injection

由protectai開發
基於DeBERTa-v3微調的提示注入檢測模型,用於識別惡意提示輸入
下載量 35.13k
發布時間 : 11/25/2023

模型概述

該模型專門用於檢測提示注入攻擊,將輸入文本分類為正常提示或惡意注入提示,幫助保護AI系統安全。

模型特點

高精度檢測
在評估集上達到99.99%的準確率和99.98%的F1值
多數據集訓練
基於12個不同來源的數據集訓練,涵蓋多種提示注入模式
多框架支持
提供原生Transformers和ONNX兩種運行方式
生態集成
支持與Langchain和LLM Guard等流行框架集成

模型能力

文本分類
惡意輸入檢測
安全防護

使用案例

AI安全
聊天機器人防護
防止惡意用戶通過提示注入攻擊操縱聊天機器人行為
有效識別99.7%的注入嘗試
API安全網關
在API網關層檢測並攔截潛在的惡意提示
內容審核
有害內容過濾
識別試圖繞過內容限制的惡意提示
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase