M

Mdeberta V3 Base Prompt Injection

由proventra開發
基於microsoft/mdeberta-v3-base微調的提示注入檢測模型,整合多個數據集訓練,用於識別惡意提示注入攻擊。
下載量 136
發布時間 : 4/10/2025

模型概述

該模型專門用於檢測大語言模型中的提示注入攻擊,能識別嵌套在合法內容中的惡意指令,保障AI系統安全。

模型特點

多源數據訓練
整合了公開數據集和自定義數據集,覆蓋多種注入攻擊模式
嵌套內容檢測
能識別隱藏在合法網站內容或文章中的惡意指令
輕量級部署
基於高效能的mDeBERTa-v3架構,平衡檢測精度與推理速度

模型能力

文本安全分析
惡意指令識別
多語言注入檢測

使用案例

AI安全防護
聊天機器人防護
防止用戶通過精心設計的提示詞繞過AI安全限制
有效攔截90%以上的已知注入模式(基於測試數據)
API安全網關
在AI服務API前端部署檢測層
即時阻斷惡意請求
內容審核
用戶生成內容篩查
檢測論壇/社區中試圖誘導AI的隱蔽指令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase