R

Roberta Hate Speech Dynabench R4 Target

facebookによって開発
このモデルは動的データセット生成を通じてオンライン憎悪検出を改善し、検出効果を高めるために最悪ケースから学習することに焦点を当てています。
ダウンロード数 2.0M
リリース時間 : 6/10/2022

モデル概要

LFTW R4 ターゲットモデルは、オンライン憎悪検出のためのモデルで、動的データセット生成を通じて憎悪発言を識別・分類し、特に検出が困難なケースに特別な注意を払います。

モデル特徴

動的データセット生成
動的データセット生成を通じて、特に識別が困難なケースに対する憎悪発言の検出能力を改善します。
最悪ケースからの学習
モデルは最悪の憎悪発言ケースから学習することに焦点を当て、検出の精度と堅牢性を向上させます。

モデル能力

憎悪発言検出
テキスト分類
動的データセット生成

使用事例

ソーシャルメディア
憎悪発言検出
ソーシャルメディアプラットフォーム上で憎悪発言を自動検出・分類し、プラットフォームのコンテンツ審査を支援します。
憎悪発言検出の精度とカバレッジを向上させます。
オンラインセキュリティ
コンテンツ審査
オンラインフォーラムやコミュニティのコンテンツ審査システムに使用され、憎悪発言を自動識別・フィルタリングします。
手動審査の作業量を削減し、審査効率を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase