S

Shieldgemma 9b

由google開發
ShieldGemma是基於Gemma 2構建的安全內容審核模型系列,針對四種危害類別(色情內容、危險內容、仇恨言論和騷擾)進行內容審核。
下載量 507
發布時間 : 7/16/2024

模型概述

ShieldGemma是僅解碼器的文本到文本大語言模型,提供英語版本並開放權重,用於安全內容審核。

模型特點

多危害類別審核
針對色情內容、危險內容、仇恨言論和騷擾四種危害類別進行內容審核。
基於Gemma 2構建
基於Gemma 2模型構建,繼承了其強大的文本理解和生成能力。
開放權重
模型權重開放,支持用戶自定義和進一步微調。
多規模選擇
提供2B、9B和27B三種參數規模的模型,適應不同計算需求。

模型能力

文本內容審核
危害內容識別
策略合規性檢查
生成式AI安全評估

使用案例

內容安全
用戶輸入過濾
檢測用戶輸入是否包含違規內容,防止不當內容進入系統。
高準確率識別危險內容、仇恨言論等
AI輸出審核
審核AI生成內容的安全性,確保輸出符合安全策略。
有效防止AI生成有害內容
社區管理
在線社區內容審核
自動審核用戶生成內容,減少人工審核工作量。
提高審核效率,降低違規內容傳播風險
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase