# LLMセキュリティ保護

Prompt Injection Defender Large V0 Onnx
TestSavantAIモデルは、大規模言語モデル(LLM)に対するプロンプトインジェクションやジェイルブレイク攻撃を防御するために特別に設計された微調整済み分類器のセットです。
テキスト分類 Transformers 英語
P
testsavantai
3,225
1
Prompt Injection Defender Large V0
TestSavantAIモデルは、大規模言語モデル(LLM)に対するプロンプトインジェクションやジェイルブレイク攻撃を防御するために設計された分類器群で、ミニ版はBERT-tinyアーキテクチャを基に、セキュリティと計算効率のバランスを取っています。
テキスト分類 Transformers 英語
P
testsavantai
23
2
Harmaug Guard
Apache-2.0
DeBERTa-v3-largeをベースに微調整されたセキュリティ保護モデルで、大規模言語モデルとの対話中の不安全な内容を検出し、脱獄攻撃を防止します。
テキスト分類 Transformers
H
hbseong
705
39
Gentelshield V1
GenTel-Shieldはプロンプトインジェクション攻撃の検出と防御に特化したモデルで、悪意のあるサンプルと良性サンプルを効果的に区別できます。
大規模言語モデル Transformers
G
GenTelLab
35
2
Prompt Guard 86M
PromptGuardは、LLMプロンプト攻撃を検出および保護するためのテキスト分類モデルで、悪意のあるプロンプトインジェクションやジェイルブレイクの試みを識別できます。
テキスト分類 Transformers 英語
P
meta-llama
33.88k
250
Deberta V3 Base Prompt Injection V2
Apache-2.0
DeBERTa-v3-baseをファインチューニングしたプロンプトインジェクション検出モデルで、言語モデルを操作する可能性のある悪意のあるプロンプトを識別します
テキスト分類 Transformers 英語
D
protectai
229.97k
50
Llamaguard 7b
70億パラメータのLlama 2を基にしたセキュリティ保護モデルで、LLMの入力出力内容を安全に分類するために使用されます
大規模言語モデル Transformers 英語
L
llamas-community
151
13
Scamllm
RoBERTaを微調整した悪意ある提示検出モデルで、釣り詐欺ウェブサイト/メールの生成を誘導する悪意ある提示を識別できます。
テキスト分類 Transformers
S
phishbot
294
7
Deberta V3 Base Prompt Injection
Apache-2.0
DeBERTa-v3をファインチューニングしたプロンプトインジェクション検出モデルで、悪意のあるプロンプト入力を識別します
テキスト分類 Transformers 英語
D
protectai
35.13k
78
Deberta V3 Base Injection Onnx
MIT
これはdeepset/deberta-v3-base-injectionモデルをONNX形式に変換したバージョンで、プロンプトインジェクション攻撃の検出に使用されます。
テキスト分類 Transformers 英語
D
protectai
30
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase