S

Shieldgemma 27b

由 google 开发
ShieldGemma是基于Gemma 2构建的一系列安全内容审核模型,针对四种危害类别(性暴露内容、危险内容、仇恨言论和骚扰)进行内容审核。
下载量 65
发布时间 : 7/16/2024

模型简介

ShieldGemma是仅解码器的大型语言模型,支持英语,开放权重,用于安全内容审核。

模型特点

多危害类别审核
针对四种危害类别(性暴露内容、危险内容、仇恨言论和骚扰)进行内容审核。
开放权重
模型权重开放,支持自定义部署和使用。
高性能
在多个基准测试中表现优于同类开源模型。
灵活部署
支持单GPU和多GPU部署,提供多种使用方式。

模型能力

文本分类
内容安全审核
生成式AI内容过滤

使用案例

内容审核
用户输入过滤
审核用户输入内容是否符合安全策略。
识别并过滤违反安全策略的用户输入。
模型输出过滤
审核AI生成内容是否符合安全策略。
识别并过滤违反安全策略的AI生成内容。
社交媒体
仇恨言论检测
检测社交媒体中的仇恨言论内容。
有效识别基于种族、性别等受保护属性的仇恨言论。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase