M

MD Judge V0 2 Internlm2 7b

Developed by OpenSafetyLab
基於internlm2-7b-chat微調的安全防護工具,提供人類可讀的判定解釋和細粒度危害評分
Downloads 1,823
Release Time : 7/21/2024

Model Overview

MD-Judge-v0.2-internlm2_7b是一款大語言模型安全防護工具,為安全評估提供可靠的參考標準,具備思維鏈推理和細粒度危害區分能力

Model Features

思維鏈推理
逐步推理得出最終判定,提供詳細的推理過程
細粒度危害評分
根據5級評分標準(從完全無害到極度有害)進行精確評估
人類可讀解釋
提供清晰的判定解釋和違規類別(如判定為不安全)

Model Capabilities

安全評估
危害評分
違規檢測
文本分析

Use Cases

AI安全
對話安全評估
評估AI對話中的潛在危害內容
提供安全/不安全判定及具體分數
內容審核
識別和標記有害或危險內容
識別違規內容並分類
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase