# LLM安全防護

Prompt Injection Defender Large V0 Onnx
TestSavantAI模型是一組經過微調的分類器,專門設計用於防禦針對大型語言模型(LLM)的提示注入和越獄攻擊。
文本分類 Transformers 英語
P
testsavantai
3,225
1
Prompt Injection Defender Large V0
TestSavantAI模型是一組專為防禦大型語言模型(LLM)提示注入和越獄攻擊而設計的分類器,微型版基於BERT-tiny架構,平衡安全性與計算效率。
文本分類 Transformers 英語
P
testsavantai
23
2
Harmaug Guard
Apache-2.0
基於DeBERTa-v3-large微調的安全防護模型,用於檢測與大語言模型對話中的不安全內容,防止越獄攻擊。
文本分類 Transformers
H
hbseong
705
39
Gentelshield V1
GenTel-Shield是一個專注於檢測和防禦提示詞注入攻擊的模型,能夠有效區分惡意樣本與良性樣本。
大型語言模型 Transformers
G
GenTelLab
35
2
Prompt Guard 86M
PromptGuard是一個用於檢測和防護LLM提示攻擊的文本分類模型,能夠識別惡意提示注入和越獄嘗試。
文本分類 Transformers 英語
P
meta-llama
33.88k
250
Deberta V3 Base Prompt Injection V2
Apache-2.0
基於DeBERTa-v3-base微調的提示詞注入檢測模型,用於識別可能操縱語言模型的惡意提示詞
文本分類 Transformers 英語
D
protectai
229.97k
50
Llamaguard 7b
基於70億參數Llama 2的安全防護模型,用於對LLM輸入輸出內容進行安全分類
大型語言模型 Transformers 英語
L
llamas-community
151
13
Scamllm
基於RoBERTa微調的惡意提示檢測模型,可識別誘導生成釣魚網站/郵件的惡意提示
文本分類 Transformers
S
phishbot
294
7
Deberta V3 Base Prompt Injection
Apache-2.0
基於DeBERTa-v3微調的提示注入檢測模型,用於識別惡意提示輸入
文本分類 Transformers 英語
D
protectai
35.13k
78
Deberta V3 Base Injection Onnx
MIT
這是deepset/deberta-v3-base-injection模型轉換為ONNX格式的版本,用於檢測提示注入攻擊。
文本分類 Transformers 英語
D
protectai
30
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase