D

Deberta V3 Base Prompt Injection V2

由protectai開發
基於DeBERTa-v3-base微調的提示詞注入檢測模型,用於識別可能操縱語言模型的惡意提示詞
下載量 229.97k
發布時間 : 4/20/2024

模型概述

該模型專門用於檢測和分類可能操縱語言模型產生意外輸出的提示詞注入攻擊,增強語言模型應用的安全性

模型特點

高準確率檢測
在獨立測試集上達到95.25%的準確率和99.74%的召回率
多數據集訓練
整合多個公開數據集,涵蓋廣泛的提示詞變體
專注英語提示詞
專門優化英語提示詞注入檢測能力
社區驅動改進
根據社區反饋持續優化模型性能

模型能力

提示詞注入檢測
文本分類
安全防護

使用案例

大語言模型安全
聊天機器人防護
檢測並阻止試圖操縱聊天機器人輸出的惡意提示詞
有效防止有害內容生成
API安全網關
集成到API網關中過濾惡意提示詞請求
提升語言模型API的安全性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase