R

Roberta Toxicity Classifier

由s-nlp開發
基於RoBERTa-large微調的毒性評論分類模型,在Jigsaw競賽數據集上訓練,用於識別英文文本中的毒性內容。
下載量 80.61k
發布時間 : 3/2/2022

模型概述

該模型專門用於對英文評論進行毒性分類,能夠有效識別文本中的有害內容。基於200萬條樣本訓練,在測試集上表現優異。

模型特點

高性能分類
在Jigsaw競賽測試集上達到AUC-ROC 0.98和F1分數0.76的優秀表現
大規模訓練數據
整合了Jigsaw三屆競賽約200萬條英文樣本進行訓練
基於RoBERTa優化
採用魯棒優化的RoBERTa-large預訓練模型進行微調

模型能力

文本毒性分類
有害內容檢測
自然語言處理

使用案例

內容審核
社交媒體評論過濾
自動識別並過濾社交媒體平臺上的有害評論
有效減少平臺上的毒性內容
在線社區管理
幫助論壇和社區管理員快速識別不當言論
提高社區內容質量
學術研究
語言毒性研究
用於研究網絡語言中的毒性特徵和模式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase