🚀 Primus:用于网络安全大语言模型训练的开源数据集先锋集合
Primus是一系列用于网络安全大语言模型训练的开源数据集,为网络安全领域的研究和应用提供了重要支持。它涵盖了预训练、指令微调等多个阶段,助力打造更强大的网络安全语言模型。
🚀 快速开始
模型信息
属性 |
详情 |
模型类型 |
文本生成 |
训练数据 |
trendmicro-ailab/Primus-Reasoning、trendmicro-ailab/Primus-Seed、trendmicro-ailab/Primus-FineWeb、trendmicro-ailab/Primus-Instruct |
基础模型 |
trendmicro-ailab/Llama-Primus-Merged |
库名称 |
transformers |
标签 |
网络安全、预训练 |
额外访问字段
在使用该模型时,需要提供以下额外信息:
- 所属机构:文本形式填写
- 国家:选择国家
- 使用目的:可选择研究、商业或其他
- 职位:可选择学生、研究毕业生、人工智能研究员、人工智能开发者/工程师、网络安全研究员、记者或其他
- 地理位置:通过IP定位
模型图片

重要声明
⚠️ 重要提示
该模型不包含趋势科技的客户信息。
最新消息
📢 新闻(2025/06/02):我们已扩展 Primus-Reasoning 数据集,加入了来自DeepSeek-R1的额外样本。相应地,我们用一个新的版本替换了Llama-Primus-Reasoning,该版本是从DeepSeek-R1和o1-preview联合提炼而来。这个版本在CISSP考试中取得了最佳性能,提升了15.8%。
✨ 主要特性
开创性的网络安全推理模型
Primus是首个网络安全推理模型,基于Llama-Primus-Merged,Llama-Primus-Reasoning是从o1-preview和DeepSeek-R1在网络安全任务中生成的带有反思数据的推理步骤中提炼出来的推理模型。它在安全认证(CISSP)中显示出了15.8%的显著提升。
多阶段数据集支持
Primus提供了一系列涵盖网络安全大语言模型训练多个阶段的数据集,包括预训练(Primus-Seed 和 Primus-FineWeb)、指令微调(Primus-Instruct)以及用于提炼的推理数据(Primus-Reasoning)。
强大的性能提升
通过在CISSP考试中的评估,Primus-Reasoning的微调效果显著,相较于无思维链(CoT)且在5次提示设置下的Llama模型有明显的百分比提升,最佳提升效果以粗体突出显示。
📚 详细文档
网络安全基准测试结果
模型 |
CISSP 成绩 |
平均令牌数 |
无思维链(CoT),5次提示 |
|
|
Llama-3.1-8B-Instruct |
0.7073 |
1 |
Llama-Primus-Merged |
0.7191 ↑1.67% |
1 |
有思维链(CoT),0次提示 |
|
|
Llama-3.1-8B-Instruct |
0.7288 ↑3.03% |
279.69 |
└─ + 从o1-preview提炼 |
0.7583 ↑7.21% |
646.94 |
└─ + 从DeepSeek-R1提炼 |
0.7859 ↑11.1% |
1667.56 |
└─ + 从(o1 + R1)提炼 |
0.7780 ↑10.0% |
1615.54 |
Llama-Primus-Merged |
0.7603 ↑7.49% |
241.92 |
└─ + 从o1-preview提炼 |
0.7780 ↑10.0% |
726.96 |
└─ + 从DeepSeek-R1提炼 |
0.8075 ↑14.2% |
1483.94 |
└─ + 从(o1 + R1)提炼 |
0.8193 ↑15.8% |
1467.40 |
用于比较的原始模型 |
|
|
o1-preview |
0.8035 |
1054.91 |
DeepSeek-R1 |
0.8212 |
1229.32 |
DeepSeek-R1-Distill-Llama-8B |
0.7399 ↑4.61% |
1542.10 |
Primus-Reasoning 微调的效果在CISSP考试中进行了评估。↑ 表示相较于无思维链(CoT)且在5次提示设置下的Llama模型的百分比提升。最佳提升效果以粗体突出显示。
关于 Primus
Primus是趋势科技开创性的轻量级、最先进的开源网络安全语言模型和数据集家族。通过我们前沿的研究计划和先进技术开发而成,这些资源共享为我们企业级 Trend Cybertron 解决方案提供支持的创新基础。作为网络安全领域的行业领导者,趋势科技自豪地将这些强大、经过效率优化的模型和数据集贡献给社区,同时保持定义我们全球安全标准的卓越性和可靠性。
📄 许可证
本模型基于MIT许可证,但您还必须遵守Llama 3.1社区许可协议。
论文链接
📄 更多详细信息,请参考论文:[📄论文]