🚀 哥伦比亚西班牙语网络欺凌分类器
本模型是 PlanTL-GOB-ES/roberta-base-bne 的微调版本,在一个通过手动收集社交网络 Twitter 上的帖子创建的数据集上进行训练,用于检测哥伦比亚西班牙语中的网络欺凌行为。
🚀 快速开始
使用 pipelines 快速使用该模型:
!pip install -q transformers
from transformers import pipeline
model_path = "FelipeGuerra/colombian-spanish-cyberbullying-classifier"
bullying_analysis = pipeline("text-classification", model=model_path, tokenizer=model_path)
bullying_analysis(
"Como dice mi mamá: va caer palo de agua"
)
[{'label': 'Not_bullying', 'score': 0.977687656879425}]
bullying_analysis(
"Esta perrita me las va pagar"
)
[{'label': 'Bullying', 'score': 0.9404164552688599}]
✨ 主要特性
📦 安装指南
!pip install -q transformers
📚 详细文档
训练和评估数据
所使用的数据集包含 3570 条推文,这些推文被手动标记为是否属于网络欺凌。该数据集的一个显著特点是,对于给定的一个单词,存在一条标注为网络欺凌的推文包含该单词,同时还有另一条标注为非网络欺凌的推文也包含该单词。这是因为同一单词在不同语境中的使用方式不同,导致推文的分类也不同。
例如,非网络欺凌类别中的推文主要包含一些在特定语境下不构成网络欺凌的脏话。比如 “Marica, se me olvidó ver el partido”。此外,非网络欺凌类别在较小程度上还包括来自哥伦比亚地区 Twitter 热门趋势的推文。Twitter 热门趋势反映了特定地区在特定时间内最热门的话题和讨论,本质上捕捉了该地理区域内人们在网上的讨论和分享内容。
当无法获取包含特定冒犯性单词或短语(如 “ojala te violen”)的非网络欺凌推文时,就会使用基于热门趋势的推文。相反,标注为网络欺凌的推文并不总是包含被认为强烈或冒犯性的单词或短语,例如 “te voy a buscar”。
网络欺凌推文和非网络欺凌推文的分布相同。数据集中使用的关键词和短语是根据 Cynthia Van Hee、Ben Verhoeven、Els Lefever、Guy De Pauw、Walter Daelemans 和 Véronique Hoste 撰写的文章 Guidelines for the Fine-Grained Analysis of Cyberbullying 中提供的类别选择的。包括四个类别:侮辱、威胁、诅咒和诽谤。侮辱类别涉及使用冒犯性词语来口头伤害他人,而威胁旨在损害受害者的人身安全。诅咒包括希望他人遭受伤害或不幸的词语,诽谤则试图损害受害者的声誉。选择这些类别是为了广泛涵盖网络欺凌的各种表现形式。
推文由与该项目相关的职业治疗师进行标注。
训练过程
训练超参数
训练期间使用了以下超参数:
- 学习率:2e-05
- 训练批次大小:8
- 评估批次大小:8
- 随机种子:42
- 权重衰减:0.01
- 热身步数:500
- 训练轮数:2
训练结果
轮数 |
ROC - AUC |
验证损失 |
训练损失 |
1.0 |
0.8756 |
0.4375 |
--- |
2.0 |
0.9022 |
0.5060 |
0.4945 |
框架版本
- Transformers 4.34.0
- Pytorch 2.0.1+cu118
- Pandas 1.5.3
- scikit - learn 1.2.2
📄 许可证
本项目采用 MIT 许可证。
由 Felipe Guerra Sáenz 创建 | 领英