deberta-v3-large-mlm-reddit-gabオープンソースモデル - オンラインでの性差別的発言を無料で検出

Deberta V3 Large Mlm Reddit Gab

MilaNLProcによって開発

このモデルはMilaNLPチームがSemEval-2023タスク10（説明可能なオンラインジェンダー差別検出）のために訓練したドメイン適応モデルで、DeBERTa-v3-largeを基にRedditとGabのコーパスでドメイン適応訓練を行った

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #ジェンダー差別検出 #ドメイン適応 #Redditテキスト分析

ダウンロード数 436

リリース時間 : 2/28/2023

モデル概要

ドメイン適応と正則化事前訓練を統合した言語モデルで、特に頑健なジェンダー差別コンテンツ検出タスクに特化している

モデル特徴

ドメイン適応訓練

RedditとGabプラットフォームの特定ドメインコーパスを使用したMLM訓練により、オンラインのジェンダー差別コンテンツ識別能力を強化

正則化統合

正則化技術を採用し語彙過学習問題を緩和、より保守的で信頼性の高い予測結果を生成

論争サンプル識別

モデルは注釈に論争のある境界事例を識別可能で、ヘイトスピーチ注釈の主観的課題を反映

モデル能力

ジェンダー差別テキスト分類

ヘイトスピーチ検出

ソーシャルメディアテキスト分析

使用事例

コンテンツモデレーション

ソーシャルメディアのジェンダー差別コンテンツフィルタリング

Redditなどのプラットフォームにおけるジェンダー差別的傾向のある投稿を自動識別

SemEval-2023タスク10で有効性が検証済み

学術研究

ヘイトスピーチ分析

オンラインのジェンダー差別発言の言語的特徴と拡散パターンを研究

論文では誤判定ケース分析を提供

🚀 トランスフォーマーモデル

このモデルは、EDOS Shared Taskに対するMilaNLPソリューションの一部としてトレーニングされ、公開されています。詳細については、論文 MilaNLP at SemEval-2023 Task 10: Ensembling Domain-Adapted and Regularized Pretrained Language Models for Robust Sexism Detection を参照してください。

📚 ドキュメント

適応詳細

我々は、タスク主催者によって提供されたラベルなしのRedditコーパス（100万投稿）（Kirk et al., 2023）とGab Hate Corpus（87,000投稿）（Kennedy et al., 2022）に対して、標準的なMLMを用いて事前学習済みのDeBERTa のドメイン適応を実行しました。2つのデータセットを連結してシャッフルした後、データソースを層別化して5%を検証データとして取り分けました。最終的なトレーニングデータセットは約2000万語でした。

完全な詳細については、論文を参照してください。

引用

このモデルを使用する場合は、以下を引用することを検討してください。

@inproceedings{cercas-curry-etal-2023-milanlp,
    title = "{M}ila{NLP} at {S}em{E}val-2023 Task 10: Ensembling Domain-Adapted and Regularized Pretrained Language Models for Robust Sexism Detection",
    author = "Cercas Curry, Amanda  and
      Attanasio, Giuseppe  and
      Nozza, Debora  and
      Hovy, Dirk",
    booktitle = "Proceedings of the 17th International Workshop on Semantic Evaluation (SemEval-2023)",
    month = jul,
    year = "2023",
    address = "Toronto, Canada",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2023.semeval-1.285",
    doi = "10.18653/v1/2023.semeval-1.285",
    pages = "2067--2074",
    abstract = "We present the system proposed by the MilaNLP team for the Explainable Detection of Online Sexism (EDOS) shared task.We propose an ensemble modeling approach to combine different classifiers trained with domain adaptation objectives and standard fine-tuning.Our results show that the ensemble is more robust than individual models and that regularized models generate more {``}conservative{''} predictions, mitigating the effects of lexical overfitting.However, our error analysis also finds that many of the misclassified instances are debatable, raising questions about the objective annotatability of hate speech data.",
}