byt5-base-tweet-hate-detection開源模型 - 精準檢測推文中的仇恨言論

首頁

Byt5 Base Tweet Hate Detection

由Narrativa開發

該模型是基於ByT5-base微調的序列分類模型，專門用於檢測推文中的仇恨言論。

文本分類英語#推文仇恨檢測 #無分詞處理 #噪聲文本優化

下載量 42

發布時間 : 3/2/2022

模型概述

該模型在推文仇恨言論檢測數據集上微調，用於識別推文中的種族主義或性別歧視內容。

模型特點

無分詞器設計

ByT5是無分詞器版本，直接處理UTF-8字節序列，特別適合處理噪聲文本數據。

針對推文優化

專門針對推文內容進行微調，能有效識別社交媒體中的仇恨言論。

處理噪聲數據能力強

在TweetsQA等噪聲文本任務上表現優於同類模型。

模型能力

文本分類

仇恨言論檢測

社交媒體內容分析

使用案例

社交媒體內容審核

自動檢測仇恨言論

自動識別推文中的種族主義或性別歧視內容

在測試集上達到79.8的F1分數

在線社區管理

過濾不當內容

幫助社區管理員快速識別並處理仇恨言論

🚀 ByT5-base針對仇恨言論檢測（推文）的微調模型

本模型是基於ByT5基礎模型，在推文仇恨言論檢測數據集上進行微調，用於序列分類下游任務。

✨ 主要特性

基於ByT5基礎模型，該模型是Google的T5的無分詞器版本，架構與MT5類似。
僅在mC4上進行預訓練，未進行任何監督訓練，平均跨度掩碼為20個UTF - 8字符，因此需微調後才能用於下游任務。
在處理噪聲文本數據方面表現出色，例如google/byt5-base在TweetQA上顯著優於mt5-base。

📦 安裝指南

git clone https://github.com/huggingface/transformers.git
pip install -q ./transformers

💻 使用示例

基礎用法

from transformers import AutoTokenizer, T5ForConditionalGeneration

ckpt = 'Narrativa/byt5-base-tweet-hate-detection'

tokenizer = AutoTokenizer.from_pretrained(ckpt)
model = T5ForConditionalGeneration.from_pretrained(ckpt).to("cuda")

def classify_tweet(tweet):

    inputs = tokenizer([tweet], padding='max_length', truncation=True, max_length=512, return_tensors='pt')
    input_ids = inputs.input_ids.to('cuda')
    attention_mask = inputs.attention_mask.to('cuda')
    output = model.generate(input_ids, attention_mask=attention_mask)
    return tokenizer.decode(output[0], skip_special_tokens=True)
    
    
classify_tweet('here goes your tweet...')

📚 詳細文檔

ByT5 - Base模型詳情 🧠

ByT5是Google的T5的無分詞器版本，總體遵循MT5的架構。ByT5僅在mC4上進行預訓練，未進行任何監督訓練，平均跨度掩碼為20個UTF - 8字符。因此，該模型在用於下游任務之前必須進行微調。ByT5在處理噪聲文本數據方面表現特別出色，例如，google/byt5-base在TweetQA上的表現顯著優於mt5-base。論文：ByT5: Towards a token-free future with pre-trained byte-to-byte models 作者：Linting Xue, Aditya Barua, Noah Constant, Rami Al - Rfou, Sharan Narang, Mihir Kale, Adam Roberts, Colin Raffel

下游任務詳情（將序列分類作為文本生成） - 數據集 📚

推文仇恨言論檢測

此任務的目標是檢測推文中的仇恨言論。為簡單起見，如果一條推文帶有種族主義或性別歧視情緒，我們就認為它包含仇恨言論。因此，該任務是將種族主義或性別歧視的推文與其他推文區分開來。

從形式上講，給定一組推文及其標籤的訓練樣本，其中標籤‘1’表示該推文是種族主義/性別歧視的，標籤‘0’表示該推文不是種族主義/性別歧視的，你的目標是對給定測試數據集上的標籤進行預測。

數據實例：數據集包含一個標籤，用於表示該推文是否為仇恨言論。

{'label': 0,  # 非仇恨言論
 'tweet': ' @user when a father is dysfunctional and is so selfish he drags his kids into his dysfunction.   #run'}

數據字段： | 屬性 | 詳情 | |------|------| | 標籤 | 1 - 是仇恨言論，0 - 不是仇恨言論 | | 推文 | 推文內容，字符串形式 |
數據劃分：數據包含31962條訓練數據。

測試集指標 🧾

我們選取了5%的條目創建了一個具有代表性的測試集。由於數據集存在嚴重的不平衡問題，模型的F1分數為79.8。

📄 許可證

文檔未提及相關許可證信息。

本模型由Narrativa創建。關於Narrativa：自然語言生成（NLG）| Gabriele是我們基於機器學習的平臺，用於構建和部署自然語言解決方案。 #NLG #AI

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫