S

Shieldgemma 27b

由google開發
ShieldGemma是基於Gemma 2構建的一系列安全內容審核模型,針對四種危害類別(性暴露內容、危險內容、仇恨言論和騷擾)進行內容審核。
下載量 65
發布時間 : 7/16/2024

模型概述

ShieldGemma是僅解碼器的大型語言模型,支持英語,開放權重,用於安全內容審核。

模型特點

多危害類別審核
針對四種危害類別(性暴露內容、危險內容、仇恨言論和騷擾)進行內容審核。
開放權重
模型權重開放,支持自定義部署和使用。
高性能
在多個基準測試中表現優於同類開源模型。
靈活部署
支持單GPU和多GPU部署,提供多種使用方式。

模型能力

文本分類
內容安全審核
生成式AI內容過濾

使用案例

內容審核
用戶輸入過濾
審核用戶輸入內容是否符合安全策略。
識別並過濾違反安全策略的用戶輸入。
模型輸出過濾
審核AI生成內容是否符合安全策略。
識別並過濾違反安全策略的AI生成內容。
社交媒體
仇恨言論檢測
檢測社交媒體中的仇恨言論內容。
有效識別基於種族、性別等受保護屬性的仇恨言論。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase