R

Roberta Hate Speech Dynabench R4 Target

Developed by facebook
このモデルは動的データセット生成を通じてオンライン憎悪検出を改善し、検出効果を高めるために最悪ケースから学習することに焦点を当てています。
Downloads 2.0M
Release Time : 6/10/2022

Model Overview

LFTW R4 ターゲットモデルは、オンライン憎悪検出のためのモデルで、動的データセット生成を通じて憎悪発言を識別・分類し、特に検出が困難なケースに特別な注意を払います。

Model Features

動的データセット生成
動的データセット生成を通じて、特に識別が困難なケースに対する憎悪発言の検出能力を改善します。
最悪ケースからの学習
モデルは最悪の憎悪発言ケースから学習することに焦点を当て、検出の精度と堅牢性を向上させます。

Model Capabilities

憎悪発言検出
テキスト分類
動的データセット生成

Use Cases

ソーシャルメディア
憎悪発言検出
ソーシャルメディアプラットフォーム上で憎悪発言を自動検出・分類し、プラットフォームのコンテンツ審査を支援します。
憎悪発言検出の精度とカバレッジを向上させます。
オンラインセキュリティ
コンテンツ審査
オンラインフォーラムやコミュニティのコンテンツ審査システムに使用され、憎悪発言を自動識別・フィルタリングします。
手動審査の作業量を削減し、審査効率を向上させます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase