rubert-tiny-toxicity開源模型 - 可對俄語文本進行毒性多標籤分類

首頁

Rubert Tiny Toxicity

由cointegrated開發

基於rubert-tiny微調的俄語文本毒性多標籤分類模型

文本分類

Transformers

其他#俄語毒性檢測 #多標籤分類 #社交媒體內容審核

下載量 10.77k

發布時間 : 3/2/2022

模型概述

該模型專門用於對俄語非正式短文本（如社交媒體評論）的毒性和不適當性進行分類，支持多標籤分類任務。

模型特點

多標籤毒性分類

能夠同時識別文本中的多種毒性類別，包括侮辱、髒話、威脅等。

俄語優化

專門針對俄語非正式短文本進行優化，適用於社交媒體評論分析。

高精度檢測

在開發集上各標籤ROC AUC指標均達到0.98以上（危險性內容為0.8295）。

模型能力

俄語文本毒性檢測

多標籤分類

社交媒體評論分析

不當內容識別

使用案例

內容審核

社交媒體評論過濾

自動識別並過濾社交媒體中的侮辱性、威脅性或不當內容。

可有效識別95%以上的毒性內容

用戶行為分析

用戶風險評分

根據用戶發佈內容評估其潛在風險等級。

可識別93%的危險性內容

🚀 微調版俄文文本毒性分類模型

本項目基於 cointegrated/rubert-tiny 模型微調，用於對俄語短文本（如社交網絡評論）的毒性和不當性進行分類。

標籤信息

屬性	詳情
語言	俄語
標籤	俄語、分類、毒性、多標籤

快速測試

你可以通過以下示例文本快速測試模型：

"Иди ты нафиг!"

🚀 快速開始

這是 cointegrated/rubert-tiny 模型的微調版本，用於對俄語短非正式文本（如社交網絡中的評論）的毒性和不當性進行分類。

問題被表述為多標籤分類，包含以下類別：

non-toxic：根據 OK ML Cup 競賽的定義，文本不包含侮辱、髒話和威脅。
insult：侮辱
obscenity：髒話
threat：威脅
dangerous：根據 Babakov 等人的定義，文本不合適，即可能損害發言者的聲譽。

如果文本同時為 non-toxic 且非 dangerous，則可認為該文本是安全的。

💻 使用示例

基礎用法

以下函數用於估計文本具有毒性或危險性的概率：

# !pip install transformers sentencepiece --quiet
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_checkpoint = 'cointegrated/rubert-tiny-toxicity'
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint)
if torch.cuda.is_available():
    model.cuda()
    
def text2toxicity(text, aggregate=True):
    """ Calculate toxicity of a text (if aggregate=True) or a vector of toxicity aspects (if aggregate=False)"""
    with torch.no_grad():
        inputs = tokenizer(text, return_tensors='pt', truncation=True, padding=True).to(model.device)
        proba = torch.sigmoid(model(**inputs).logits).cpu().numpy()
    if isinstance(text, str):
        proba = proba[0]
    if aggregate:
        return 1 - proba.T[0] * (1 - proba.T[-1])
    return proba

print(text2toxicity('я люблю нигеров', True))
# 0.9350118728093193

print(text2toxicity('я люблю нигеров', False))
# [0.9715758  0.0180863  0.0045551  0.00189755 0.9331106 ]

print(text2toxicity(['я люблю нигеров', 'я люблю африканцев'], True))
# [0.93501186 0.04156357]

print(text2toxicity(['я люблю нигеров', 'я люблю африканцев'], False))
# [[9.7157580e-01 1.8086294e-02 4.5550885e-03 1.8975559e-03 9.3311059e-01]
#  [9.9979788e-01 1.9048342e-04 1.5297388e-04 1.7452303e-04 4.1369814e-02]]

🔧 技術細節

該模型在 OK ML Cup 和 Babakov 等人的聯合數據集上進行訓練，使用 Adam 優化器，學習率為 1e-5，批量大小為 64，訓練了 15 個週期，具體訓練過程可參考 Colab 筆記本。

如果文本的不當性得分高於 0.8，則認為該文本不合適；如果得分低於 0.2，則認為該文本合適。開發集上每個標籤的 ROC AUC 如下：

non-toxic  : 0.9937
insult     : 0.9912
obscenity  : 0.9881
threat     : 0.9910
dangerous  : 0.8295

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫