オープンソースのスペイン語冒犯的言語検出モデル - スペイン語の冒犯的な用語を正確に識別する

Spanish Offensive Language Bert Base Spanish Wwm Cased

jorgeortizfuentesによって開発

BERTアーキテクチャに基づくスペイン語の冒犯的言語検出モデルで、スペイン語の冒犯的言語データセットで微調整されました。

ダウンロード数 19

リリース時間 : 12/11/2023

モデル概要

このモデルはスペイン語のテキスト分類に使用され、特に冒犯的言語を検出します。dccuchile/bert-base-spanish-wwm-casedモデルをベースに微調整され、評価セットでのF1値は0.586です。

スペイン語専用

スペイン語の事前学習モデルをベースに微調整され、スペイン語のテキストに対する理解能力が向上します。

冒犯的言語検出

スペイン語の冒犯的コンテンツを対象に分類識別を行います。

Whole Word Masking

全単語マスキングの事前学習戦略を使用し、モデルのスペイン語理解能力を向上させます。

スペイン語のテキスト分類

冒犯的コンテンツ識別

自然言語理解

コンテンツ審査

ソーシャルメディアコンテンツのフィルタリング

スペイン語のソーシャルメディアの冒犯的コンテンツを自動検出します。

F1値0.586

オンラインコミュニティ管理

フォーラム管理者が不適切な発言を識別してフィルタリングするのを支援します。

プロパティ	詳細
言語	スペイン語
タグ	generated_from_trainer
データセット	jorgeortizfuentes/spanish-offensive-language
評価指標	F1
モデル名	spanish-offensive-language-bert-base-spanish-wwm-cased
タスク名	テキスト分類
タスクタイプ	テキスト分類
データセット名	jorgeortizfuentes/spanish-offensive-language
データセットタイプ	jorgeortizfuentes/spanish-offensive-language
評価指標名	F1
評価指標タイプ	F1
評価指標値	0.5861096817040292