Bloomz 3b Guardrail
B

Bloomz 3b Guardrail

cmarkeaによって開発
Bloomz-3b-guardrailは、Bloomz-3b-sft-chatをファインチューニングしたテキスト分類モデルで、5種類のモードのテキスト毒性を検出するために使用されます。
ダウンロード数 249
リリース時間 : 12/1/2023

モデル概要

このモデルは、生成モデルの出力を監視および制御し、テキストの猥褻な内容、色情的な明示的内容、身份攻撃、侮辱、脅威の5種類のモードでの毒性レベルを検出することを目的としています。

モデル特徴

マルチモード毒性検出
テキストの猥褻な内容、色情的な明示的内容、身份攻撃、侮辱、脅威の5種類のモードでの毒性を検出することができます。
高い相関性
モデルの出力は評価者のスコアと高度に相関しており、ピアソン相関係数は約80です。
多言語対応
英語とフランス語の毒性検出をサポートしています。

モデル能力

テキスト毒性検出
マルチモード分類
多言語処理

使用事例

コンテンツ審査
ソーシャルメディアコンテンツの監視
ソーシャルメディア上の有害コンテンツ(侮辱、脅威など)を検出するために使用されます。
複数の毒性モードを正確に識別し、プラットフォームが違反コンテンツを迅速に処理するのに役立ちます。
生成モデル出力の制御
生成モデルの出力を監視し、有害コンテンツを生成しないようにします。
生成コンテンツの毒性を効果的に低減し、ユーザー体験を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase