T

Thinkguard

由 Rakancorle1 开发
ThinkGuard 是一款先进的护栏模型,旨在通过审慎的慢思考增强安全分类能力。
下载量 23
发布时间 : 2/25/2025

模型简介

ThinkGuard 基于 LLaMA-Guard-3-8B 微调,利用结构化批评来改进安全推理,同时保持计算效率。它能够跨多种危害类别进行准确安全分类,并提供结构化批评以支持安全评估。

模型特点

跨多种危害类别的准确安全分类
能够识别多种安全风险类别,提供精确的分类结果。
结构化批评
为安全评估提供解释依据,增强决策的透明度和可解释性。
可扩展性和效率
适用于实际部署,保持计算效率的同时提升安全分类能力。

模型能力

安全分类
结构化批评
多类别风险识别

使用案例

内容安全审核
对话内容安全评估
评估对话中代理消息是否包含不安全内容,并提供违规类别列表。
输出安全评估结果及违规类别,增强内容审核的透明度和准确性。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase