M

MD Judge V0 2 Internlm2 7b

由OpenSafetyLab開發
基於internlm2-7b-chat微調的安全防護工具,提供人類可讀的判定解釋和細粒度危害評分
下載量 1,823
發布時間 : 7/21/2024

模型概述

MD-Judge-v0.2-internlm2_7b是一款大語言模型安全防護工具,為安全評估提供可靠的參考標準,具備思維鏈推理和細粒度危害區分能力

模型特點

思維鏈推理
逐步推理得出最終判定,提供詳細的推理過程
細粒度危害評分
根據5級評分標準(從完全無害到極度有害)進行精確評估
人類可讀解釋
提供清晰的判定解釋和違規類別(如判定為不安全)

模型能力

安全評估
危害評分
違規檢測
文本分析

使用案例

AI安全
對話安全評估
評估AI對話中的潛在危害內容
提供安全/不安全判定及具體分數
內容審核
識別和標記有害或危險內容
識別違規內容並分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase