B

Bert Base Uncased Hatexplain Rationale Two

Hate-speech-CNERGによって開発
BERTベースのテキスト分類モデルで、仇恨発言と不快な内容を検出し、合理的な根拠を予測します。
ダウンロード数 523
リリース時間 : 3/2/2022

モデル概要

このモデルは、テキストを「侮辱的な内容」または「正常な内容」に分類するために使用されます。訓練データはGabとTwitterプラットフォームから収集され、人間によるアノテーションの合理的な根拠を融合して性能を向上させます。

モデル特徴

合理的な根拠の予測
侮辱的な文に対して、その根拠の断片を予測でき、モデルの説明可能性を向上させます。
複数のプラットフォームのデータでの訓練
訓練データはGabとTwitterプラットフォームから収集され、多様なネットワーク言語表現をカバーしています。
人間のアノテーションによる強化
人間によるアノテーションの合理的な根拠を融合して訓練し、分類の精度を向上させます。

モデル能力

テキスト分類
仇恨発言検出
不快な内容の識別
説明可能性分析

使用事例

コンテンツ審査
ソーシャルメディアコンテンツのフィルタリング
プラットフォーム上の仇恨発言と不快な内容を自動的に識別してマークします。
人手による審査の作業量を減らすことができます。
オンラインコミュニティ管理
コミュニティ管理者が違反コンテンツを迅速に特定するのを支援します。
コミュニティ管理の効率を向上させます。
学術研究
仇恨発言分析
言語学または社会学の分野での仇恨発言パターンの研究に使用されます。
定量分析ツールを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase