🚀 哥倫比亞西班牙語網絡欺凌分類器
本模型是 PlanTL-GOB-ES/roberta-base-bne 的微調版本,在一個通過手動收集社交網絡 Twitter 上的帖子創建的數據集上進行訓練,用於檢測哥倫比亞西班牙語中的網絡欺凌行為。
🚀 快速開始
使用 pipelines 快速使用該模型:
!pip install -q transformers
from transformers import pipeline
model_path = "FelipeGuerra/colombian-spanish-cyberbullying-classifier"
bullying_analysis = pipeline("text-classification", model=model_path, tokenizer=model_path)
bullying_analysis(
"Como dice mi mamá: va caer palo de agua"
)
[{'label': 'Not_bullying', 'score': 0.977687656879425}]
bullying_analysis(
"Esta perrita me las va pagar"
)
[{'label': 'Bullying', 'score': 0.9404164552688599}]
✨ 主要特性
📦 安裝指南
!pip install -q transformers
📚 詳細文檔
訓練和評估數據
所使用的數據集包含 3570 條推文,這些推文被手動標記為是否屬於網絡欺凌。該數據集的一個顯著特點是,對於給定的一個單詞,存在一條標註為網絡欺凌的推文包含該單詞,同時還有另一條標註為非網絡欺凌的推文也包含該單詞。這是因為同一單詞在不同語境中的使用方式不同,導致推文的分類也不同。
例如,非網絡欺凌類別中的推文主要包含一些在特定語境下不構成網絡欺凌的髒話。比如 “Marica, se me olvidó ver el partido”。此外,非網絡欺凌類別在較小程度上還包括來自哥倫比亞地區 Twitter 熱門趨勢的推文。Twitter 熱門趨勢反映了特定地區在特定時間內最熱門的話題和討論,本質上捕捉了該地理區域內人們在網上的討論和分享內容。
當無法獲取包含特定冒犯性單詞或短語(如 “ojala te violen”)的非網絡欺凌推文時,就會使用基於熱門趨勢的推文。相反,標註為網絡欺凌的推文並不總是包含被認為強烈或冒犯性的單詞或短語,例如 “te voy a buscar”。
網絡欺凌推文和非網絡欺凌推文的分佈相同。數據集中使用的關鍵詞和短語是根據 Cynthia Van Hee、Ben Verhoeven、Els Lefever、Guy De Pauw、Walter Daelemans 和 Véronique Hoste 撰寫的文章 Guidelines for the Fine-Grained Analysis of Cyberbullying 中提供的類別選擇的。包括四個類別:侮辱、威脅、詛咒和誹謗。侮辱類別涉及使用冒犯性詞語來口頭傷害他人,而威脅旨在損害受害者的人身安全。詛咒包括希望他人遭受傷害或不幸的詞語,誹謗則試圖損害受害者的聲譽。選擇這些類別是為了廣泛涵蓋網絡欺凌的各種表現形式。
推文由與該項目相關的職業治療師進行標註。
訓練過程
訓練超參數
訓練期間使用了以下超參數:
- 學習率:2e-05
- 訓練批次大小:8
- 評估批次大小:8
- 隨機種子:42
- 權重衰減:0.01
- 熱身步數:500
- 訓練輪數:2
訓練結果
輪數 |
ROC - AUC |
驗證損失 |
訓練損失 |
1.0 |
0.8756 |
0.4375 |
--- |
2.0 |
0.9022 |
0.5060 |
0.4945 |
框架版本
- Transformers 4.34.0
- Pytorch 2.0.1+cu118
- Pandas 1.5.3
- scikit - learn 1.2.2
📄 許可證
本項目採用 MIT 許可證。
由 Felipe Guerra Sáenz 創建 | 領英