rubert-tiny-toxicity开源模型 - 可对俄语文本进行毒性多标签分类

首页

Rubert Tiny Toxicity

由 cointegrated 开发

基于rubert-tiny微调的俄语文本毒性多标签分类模型

文本分类

Transformers

其他#俄语毒性检测 #多标签分类 #社交媒体内容审核

下载量 10.77k

发布时间 : 3/2/2022

模型简介

该模型专门用于对俄语非正式短文本（如社交媒体评论）的毒性和不适当性进行分类，支持多标签分类任务。

模型特点

多标签毒性分类

能够同时识别文本中的多种毒性类别，包括侮辱、脏话、威胁等。

俄语优化

专门针对俄语非正式短文本进行优化，适用于社交媒体评论分析。

高精度检测

在开发集上各标签ROC AUC指标均达到0.98以上（危险性内容为0.8295）。

模型能力

俄语文本毒性检测

多标签分类

社交媒体评论分析

不当内容识别

使用案例

内容审核

社交媒体评论过滤

自动识别并过滤社交媒体中的侮辱性、威胁性或不当内容。

可有效识别95%以上的毒性内容

用户行为分析

用户风险评分

根据用户发布内容评估其潜在风险等级。

可识别93%的危险性内容

🚀 微调版俄文文本毒性分类模型

本项目基于 cointegrated/rubert-tiny 模型微调，用于对俄语短文本（如社交网络评论）的毒性和不当性进行分类。

标签信息

属性	详情
语言	俄语
标签	俄语、分类、毒性、多标签

快速测试

你可以通过以下示例文本快速测试模型：

"Иди ты нафиг!"

🚀 快速开始

这是 cointegrated/rubert-tiny 模型的微调版本，用于对俄语短非正式文本（如社交网络中的评论）的毒性和不当性进行分类。

问题被表述为多标签分类，包含以下类别：

non-toxic：根据 OK ML Cup 竞赛的定义，文本不包含侮辱、脏话和威胁。
insult：侮辱
obscenity：脏话
threat：威胁
dangerous：根据 Babakov 等人的定义，文本不合适，即可能损害发言者的声誉。

如果文本同时为 non-toxic 且非 dangerous，则可认为该文本是安全的。

💻 使用示例

基础用法

以下函数用于估计文本具有毒性或危险性的概率：

# !pip install transformers sentencepiece --quiet
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_checkpoint = 'cointegrated/rubert-tiny-toxicity'
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint)
if torch.cuda.is_available():
    model.cuda()
    
def text2toxicity(text, aggregate=True):
    """ Calculate toxicity of a text (if aggregate=True) or a vector of toxicity aspects (if aggregate=False)"""
    with torch.no_grad():
        inputs = tokenizer(text, return_tensors='pt', truncation=True, padding=True).to(model.device)
        proba = torch.sigmoid(model(**inputs).logits).cpu().numpy()
    if isinstance(text, str):
        proba = proba[0]
    if aggregate:
        return 1 - proba.T[0] * (1 - proba.T[-1])
    return proba

print(text2toxicity('я люблю нигеров', True))
# 0.9350118728093193

print(text2toxicity('я люблю нигеров', False))
# [0.9715758  0.0180863  0.0045551  0.00189755 0.9331106 ]

print(text2toxicity(['я люблю нигеров', 'я люблю африканцев'], True))
# [0.93501186 0.04156357]

print(text2toxicity(['я люблю нигеров', 'я люблю африканцев'], False))
# [[9.7157580e-01 1.8086294e-02 4.5550885e-03 1.8975559e-03 9.3311059e-01]
#  [9.9979788e-01 1.9048342e-04 1.5297388e-04 1.7452303e-04 4.1369814e-02]]

🔧 技术细节

该模型在 OK ML Cup 和 Babakov 等人的联合数据集上进行训练，使用 Adam 优化器，学习率为 1e-5，批量大小为 64，训练了 15 个周期，具体训练过程可参考 Colab 笔记本。

如果文本的不当性得分高于 0.8，则认为该文本不合适；如果得分低于 0.2，则认为该文本合适。开发集上每个标签的 ROC AUC 如下：

non-toxic  : 0.9937
insult     : 0.9912
obscenity  : 0.9881
threat     : 0.9910
dangerous  : 0.8295

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库