B

Bert Base Uncased Hatexplain

由Hate-speech-CNERG開發
HateXplain是一個用於檢測仇恨言論、冒犯性內容和正常內容的文本分類模型,基於Gab和Twitter數據訓練,並引入人工標註依據提升性能。
下載量 3,831
發布時間 : 3/2/2022

模型概述

該模型專注於社交媒體文本的三分類任務(仇恨言論/冒犯性內容/正常內容),通過可解釋性增強的標註數據提高檢測準確性。

模型特點

多類別分類
同時識別仇恨言論、冒犯性內容和正常內容三類文本
可解釋性增強
訓練數據包含人工標註依據,提高模型決策的可解釋性
跨平臺數據
整合Gab和Twitter兩大社交平臺數據,增強泛化能力

模型能力

文本分類
仇恨言論檢測
內容安全過濾

使用案例

內容審核
社交媒體內容過濾
自動識別並標記平臺上的仇恨言論和冒犯性內容
減少人工審核工作量,提高有害內容識別效率
學術研究
仇恨言論模式分析
用於研究網絡仇恨言論的語言特徵和傳播規律
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase