T

Thinkguard

由Rakancorle1開發
ThinkGuard 是一款先進的護欄模型,旨在通過審慎的慢思考增強安全分類能力。
下載量 23
發布時間 : 2/25/2025

模型概述

ThinkGuard 基於 LLaMA-Guard-3-8B 微調,利用結構化批評來改進安全推理,同時保持計算效率。它能夠跨多種危害類別進行準確安全分類,並提供結構化批評以支持安全評估。

模型特點

跨多種危害類別的準確安全分類
能夠識別多種安全風險類別,提供精確的分類結果。
結構化批評
為安全評估提供解釋依據,增強決策的透明度和可解釋性。
可擴展性和效率
適用於實際部署,保持計算效率的同時提升安全分類能力。

模型能力

安全分類
結構化批評
多類別風險識別

使用案例

內容安全審核
對話內容安全評估
評估對話中代理消息是否包含不安全內容,並提供違規類別列表。
輸出安全評估結果及違規類別,增強內容審核的透明度和準確性。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase