Prompt Injection Defender Large V0 Onnx
TestSavantAIモデルは、大規模言語モデル(LLM)に対するプロンプトインジェクションやジェイルブレイク攻撃を防御するために特別に設計された微調整済み分類器のセットです。
テキスト分類
Transformers 英語

P
testsavantai
3,225
1
Prompt Injection Defender Large V0
TestSavantAIモデルは、大規模言語モデル(LLM)に対するプロンプトインジェクションやジェイルブレイク攻撃を防御するために設計された分類器群で、ミニ版はBERT-tinyアーキテクチャを基に、セキュリティと計算効率のバランスを取っています。
テキスト分類
Transformers 英語

P
testsavantai
23
2
Harmaug Guard
Apache-2.0
DeBERTa-v3-largeをベースに微調整されたセキュリティ保護モデルで、大規模言語モデルとの対話中の不安全な内容を検出し、脱獄攻撃を防止します。
テキスト分類
Transformers

H
hbseong
705
39
Gentelshield V1
GenTel-Shieldはプロンプトインジェクション攻撃の検出と防御に特化したモデルで、悪意のあるサンプルと良性サンプルを効果的に区別できます。
大規模言語モデル
Transformers

G
GenTelLab
35
2
Prompt Guard 86M
PromptGuardは、LLMプロンプト攻撃を検出および保護するためのテキスト分類モデルで、悪意のあるプロンプトインジェクションやジェイルブレイクの試みを識別できます。
テキスト分類
Transformers 英語

P
meta-llama
33.88k
250
Deberta V3 Base Prompt Injection V2
Apache-2.0
DeBERTa-v3-baseをファインチューニングしたプロンプトインジェクション検出モデルで、言語モデルを操作する可能性のある悪意のあるプロンプトを識別します
テキスト分類
Transformers 英語

D
protectai
229.97k
50
Llamaguard 7b
70億パラメータのLlama 2を基にしたセキュリティ保護モデルで、LLMの入力出力内容を安全に分類するために使用されます
大規模言語モデル
Transformers 英語

L
llamas-community
151
13
Scamllm
RoBERTaを微調整した悪意ある提示検出モデルで、釣り詐欺ウェブサイト/メールの生成を誘導する悪意ある提示を識別できます。
テキスト分類
Transformers

S
phishbot
294
7
Deberta V3 Base Prompt Injection
Apache-2.0
DeBERTa-v3をファインチューニングしたプロンプトインジェクション検出モデルで、悪意のあるプロンプト入力を識別します
テキスト分類
Transformers 英語

D
protectai
35.13k
78
Deberta V3 Base Injection Onnx
MIT
これはdeepset/deberta-v3-base-injectionモデルをONNX形式に変換したバージョンで、プロンプトインジェクション攻撃の検出に使用されます。
テキスト分類
Transformers 英語

D
protectai
30
2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98