mdeberta-v3-base-prompt-injection開源模型 - 檢測惡意提示注入攻擊，保障信息安全

首頁

Mdeberta V3 Base Prompt Injection

由proventra開發

基於microsoft/mdeberta-v3-base微調的提示注入檢測模型，整合多個數據集訓練，用於識別惡意提示注入攻擊。

文本分類

Transformers

開源協議:MIT #提示注入檢測 #多源訓練數據 #大語言模型安全

下載量 136

發布時間 : 4/10/2025

模型概述

該模型專門用於檢測大語言模型中的提示注入攻擊，能識別嵌套在合法內容中的惡意指令，保障AI系統安全。

模型特點

多源數據訓練

整合了公開數據集和自定義數據集，覆蓋多種注入攻擊模式

嵌套內容檢測

能識別隱藏在合法網站內容或文章中的惡意指令

輕量級部署

基於高效能的mDeBERTa-v3架構，平衡檢測精度與推理速度

模型能力

文本安全分析

惡意指令識別

多語言注入檢測

使用案例

AI安全防護

聊天機器人防護

防止用戶通過精心設計的提示詞繞過AI安全限制

有效攔截90%以上的已知注入模式（基於測試數據）

API安全網關

在AI服務API前端部署檢測層

即時阻斷惡意請求

內容審核

用戶生成內容篩查

檢測論壇/社區中試圖誘導AI的隱蔽指令

屬性	詳情
模型名稱	mdeberta-v3-base-prompt-injection
基礎模型	microsoft/mdeberta-v3-base
標籤	prompt-injection、injection、security、llm-security、generated_from_trainer
評估指標	accuracy、precision、recall、f1

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Mdeberta V3 Base Prompt Injection

模型概述

模型特點

模型能力

使用案例

🚀 mdeberta-v3-base-prompt-injection

🚀 快速開始

模型使用

在 Proventra Core 中使用

📄 許可證

📋 模型信息