one-for-all-toxicity-v3開源文本毒性檢測模型 - 支持55種語言識別有害垃圾內容

首頁

One For All Toxicity V3

由FredZhang7開發

多語言文本毒性檢測模型，支持55種語言，用於識別有害或垃圾內容

文本分類

Transformers

支持多種語言#多語言毒性檢測 #高精度文本審核 #短文本優化

下載量 570

發布時間 : 6/29/2023

模型概述

基於BERT架構的多語言文本分類模型，專門用於內容審核場景中的毒性檢測，可識別多種語言的有害文本內容

模型特點

多語言支持

支持55種語言的毒性檢測，包括主流語言和部分小眾語言

高準確率

英語訓練準確率達99.5%，其他語言達98.6%，最終驗證準確率96.8%

優化短文本檢測

通過人工標註補充訓練數據，改善了短文本分類精度

高效架構

基於bert-base-multilingual-cased優化，在資源有限條件下表現優異

模型能力

多語言文本分類

有害內容識別

垃圾內容檢測

內容審核輔助

使用案例

內容審核

社交媒體內容過濾

自動識別用戶生成內容中的有害信息

可有效減少人工審核工作量

多語言論壇管理

檢測多種語言的垃圾或不當內容

支持55種語言的即時檢測

網絡安全

網絡欺凌預防

識別聊天和評論中的攻擊性語言

幫助創建更安全的在線環境

🚀 通用毒性檢測模型 v3

本項目是一個多語言文本分類模型，主要用於文本的毒性檢測，支持多種語言，在不同語言的文本分類任務中表現出色。

🚀 快速開始

模型鏈接

distilbert垃圾郵件防護模型鏈接
可以在此頁面找到v1（TensorFlow）版本的SavedModel格式模型。v1模型的許可證為Apache 2.0。

模型對比

屬性	v3詳情	v1詳情
基礎模型	bert-base-multilingual-cased	nlpaueb/legal-bert-small-uncased
基礎分詞器	bert-base-multilingual-cased	bert-base-multilingual-cased
框架	PyTorch	TensorFlow
數據集大小	300萬	268萬
訓練集劃分	80%英語 20%英語 + 100%多語言	無
英語訓練準確率	99.5%	未提供 (≈97.5%)
其他語言訓練準確率	98.6%	96.6%
最終驗證準確率	96.8%	94.6%
支持語言數量	55種	未提供 (≈35種)
超參數	maxlen=208 padding='max_length' batch_size=112 optimizer=AdamW learning_rate=1e-5 loss=BCEWithLogitsLoss()	maxlen=192 padding='max_length' batch_size=16 optimizer=Adam learning_rate=1e-5 loss="binary_crossentropy"
訓練停止時間	2023年7月20日	2022年9月5日

訓練數據說明

我在Toxi Text 3M數據集的基礎上手動標註了更多數據，並將其添加到訓練集中。僅使用Toxi Text 3M進行訓練會導致模型有偏差，對短文本的分類精度較低。

模型選擇說明

在v2版本的模型測試中，測試了roberta、xlm-roberta、bert-small、bert-base-cased/uncased、bert-multilingual-cased/uncased和alberta-large-v2等模型。最終選擇了bert-multilingual-cased，因為在這個特定任務中，它在相同資源下表現更好。

💻 使用示例

基礎用法

text = "hello world!"

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tokenizer = AutoTokenizer.from_pretrained("FredZhang7/one-for-all-toxicity-v3")
model = AutoModelForSequenceClassification.from_pretrained("FredZhang7/one-for-all-toxicity-v3").to(device)

encoding = tokenizer.encode_plus(
    text,
    add_special_tokens=True,
    max_length=208,
    padding="max_length",
    truncation=True,
    return_tensors="pt"
)
print('device:', device)
input_ids = encoding["input_ids"].to(device)
attention_mask = encoding["attention_mask"].to(device)

with torch.no_grad():
    outputs = model(input_ids, attention_mask=attention_mask)
    logits = outputs.logits
    predicted_labels = torch.argmax(logits, dim=1)

print(predicted_labels)