bert-spanish-toxicity開源模型 - 精準識別西班牙語文本中的毒性內容

Bert Spanish Toxicity

由bgonzalezbustamante開發

基於BETO（西班牙語BERT基礎模型）微調的毒性檢測模型，用於識別西班牙語文本中的毒性內容。

下載量 85

發布時間 : 11/4/2024

模型概述

該模型專門用於西班牙語文本的毒性分類，能夠區分非毒性（NONTOXIC）和毒性（TOXIC）內容，主要應用於社交媒體內容審核和在線互動分析。

西班牙語專用

基於專為西班牙語優化的BERT模型（BETO）微調，針對西班牙語毒性內容檢測效果優異。

抗議事件數據訓練

使用拉丁美洲抗議事件中的真實社交媒體數據訓練，特別適合分析高衝突場景下的毒性語言。

黃金標準數據集

訓練數據來自精心標註的黃金標準數據集，包含約500萬條數據點。

西班牙語文本分類

毒性內容檢測

社交媒體內容分析

內容審核

社交媒體毒性評論過濾

自動識別並過濾西班牙語社交媒體中的毒性評論

準確率83.5%，F1分數84.9%

社會研究

抗議事件語言分析

分析抗議事件中社交媒體互動的毒性水平

特別適用於阿根廷、智利等西班牙語國家的抗議事件分析

屬性	詳情
模型類型	用於西班牙語毒性分類的微調BERT模型
基礎模型	dccuchile/bert-base-spanish-wwm-cased
訓練數據集	bgonzalezbustamante/toxicity-protests-ES
二氧化碳排放量	1.2345
許可證	MIT
語言	西班牙語
任務類型	文本分類
庫名稱	transformers