Bloomz 3b Guardrail
B

Bloomz 3b Guardrail

由cmarkea開發
Bloomz-3b-guardrail是一款基於Bloomz-3b-sft-chat微調的文本分類模型,用於檢測五種模式的文本毒性。
下載量 249
發布時間 : 12/1/2023

模型概述

該模型旨在監控和控制生成模型的輸出,檢測文本在淫穢內容、色情明示內容、身份攻擊、侮辱和威脅五種模式下的毒性程度。

模型特點

多模式毒性檢測
能夠檢測文本在淫穢內容、色情明示內容、身份攻擊、侮辱和威脅五種模式下的毒性。
高相關性
模型輸出與評委分數高度相關,皮爾遜相關性約為80。
多語言支持
支持英語和法語的毒性檢測。

模型能力

文本毒性檢測
多模式分類
多語言處理

使用案例

內容審核
社交媒體內容監控
用於檢測社交媒體上的有害內容,如侮辱、威脅等。
能夠準確識別多種毒性模式,幫助平臺及時處理違規內容。
生成模型輸出控制
監控生成模型的輸出,確保其不產生有害內容。
有效降低生成內容的毒性,提升用戶體驗。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase