DistilBERT-base-multilingual-cased-toxicity Open-source Model - Free Deployment for Precise Identification of Text Toxicity in 10 Languages

Distilbert Base Multilingual Cased Toxicity

Developed by citizenlab

A multilingual text toxicity classification model trained on the JIGSAW Toxic Comment Classification Challenge dataset, supporting 10 languages.

Text Classification

Transformers

Supports Multiple Languages#Multilingual Toxicity Detection #High-Precision Text Classification #Social Media Content Moderation

Downloads 12.69k

Release Time : 3/2/2022

Model Overview

This model is used to detect toxic content in text, based on the Distil-Bert architecture, optimized for multilingual environments, suitable for scenarios such as content moderation.

Model Features

Multilingual Support

Supports toxicity detection in 10 major European languages.

Efficient and Lightweight

Based on the Distil-Bert architecture, reducing computational resource requirements while maintaining performance.

High Accuracy

Achieves 94.25% accuracy on the JIGSAW dataset.

Model Capabilities

Text Toxicity Detection

Multilingual Text Classification

Content Moderation

Use Cases

Content Moderation

Social Media Comment Filtering

Automatically identifies and filters toxic comments on social media.

Accuracy 94.25%, F1 score 0.945

Online Community Management

Helps community administrators identify inappropriate remarks.

Property	Details
Pipeline Type	text - classification
Supported Languages	en, nl, fr, pt, it, es, de, da, pl, af
Datasets	jigsaw_toxicity_pred
Metrics	F1 Accuracy

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Distilbert Base Multilingual Cased Toxicity

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 citizenlab/distilbert-base-multilingual-cased-toxicity

🚀 Quick Start

Model Information

Widget Examples

💻 Usage Examples

Basic Usage

📚 Documentation

Evaluation

Accuracy