Prompt Injection Defender Large V0 Onnx
TestSavantAI模型是一组经过微调的分类器,专门设计用于防御针对大型语言模型(LLM)的提示注入和越狱攻击。
Downloads 3,225
Release Time : 11/27/2024
Model Overview
该模型采用BERT架构,专注于检测和拦截恶意提示,保护LLM免受提示注入和越狱攻击。
Model Features
防护效能评分(GES)
综合攻击成功率(ASR)与误拒率(FRR)的创新评估指标
多尺寸变体
提供不同规格模型以平衡性能与计算效率
ONNX支持
提供ONNX版本,便于部署和优化推理性能
Model Capabilities
恶意提示检测
越狱攻击防御
文本分类
Use Cases
AI安全
提示注入防御
检测并拦截试图绕过LLM安全限制的恶意提示
有效降低提示注入攻击的成功率
越狱攻击防护
防止用户通过特殊构造的提示获取LLM的未授权访问
减少LLM被滥用的风险
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98