dehatebert-mono-italianオープンソースモデル - 正確にイタリア語のヘイトスピーチを検出、無料でデプロイ可能！

Dehatebert Mono Italian

Hate-speech-CNERGによって開発

多言語BERTを微調整したイタリア語憎悪発言検出モデルで、英語データを使用して訓練されました。

テキスト分類その他オープンソースライセンス:Apache-2.0 #イタリア語の憎悪発言検出 #単言語微調整モデル #BERT微調整

ダウンロード数 1,332

リリース時間 : 3/2/2022

モデル概要

このモデルは、イタリア語の憎悪発言を検出するために特別に設計されており、単言語（mono）設定を採用しており、つまり英語データのみを使用して訓練されています。多言語BERTアーキテクチャをベースに微調整されており、ソーシャルメディアコンテンツの審査などのシーンに適しています。

モデル特徴

言語間転移学習

英語データのみを使用して訓練されていますが、イタリア語の憎悪発言を効果的に検出することができます。

高性能検証

最高の検証スコアは0.837288（F1スコアまたは正解率）に達しました。

学術研究のサポート

ECML - PKDD 2020会議論文に基づく深層学習手法を使用しています。

モデル能力

イタリア語テキスト分類

憎悪発言識別

ソーシャルメディアコンテンツ分析

使用事例

コンテンツ審査

ソーシャルメディアの憎悪発言フィルタリング

イタリア語のソーシャルメディアの憎悪発言コンテンツを自動的に識別します。

検証スコアは0.837288で、人手による審査を効果的に支援することができます。

学術研究

言語間憎悪発言検出研究

単言語訓練モデルの多言語シーンでの性能を研究します。

言語間NLP研究に事例を提供します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Dehatebert Mono Italian

モデル概要

モデル特徴

モデル能力

使用事例

🚀 イタリア語ヘイトスピーチ検出モデル

📚 ドキュメント

論文の詳細

📄 ライセンス