Hate Speech Multilabel Classification With Bert
BERTベースのヘイトスピーチ多ラベル分類器で、テキスト中の人種、宗教、出身、性別、性的指向、年齢、障害などに基づくヘイトスピーチカテゴリを識別します。
ダウンロード数 91
リリース時間 : 6/21/2023
モデル概要
このモデルはカリフォルニア大学バークレー校D-Labのヘイトスピーチデータセットで訓練されており、ソーシャルメディアのコメント中のヘイトスピーチを多ラベル分類できます。
モデル特徴
多ラベル分類
テキスト中の複数のヘイトスピーチカテゴリ(人種、宗教、出身など)を同時に識別できます。
データ視点主義
データセットにはアノテーターの背景情報(イデオロギー、収入、人種など)が含まれており、ヘイトスピーチ判断に対するアノテーターの視点の影響を理解するのに役立ちます。
転移学習
BERTを使用した転移学習により、事前訓練モデルを活用して分類性能を向上させます。
モデル能力
ヘイトスピーチ検出
多ラベルテキスト分類
ソーシャルメディアコメント分析
使用事例
ソーシャルメディアコンテンツ審査
ヘイトスピーチフィルタリング
ソーシャルメディアプラットフォーム上のヘイトスピーチコンテンツを自動的に識別・フィルタリングします。
コンテンツ審査効率を向上させ、手動審査作業を削減します。
学術研究
ヘイトスピーチ分析
ヘイトスピーチの分布と特徴を研究し、その社会的影響を理解するのに役立ちます。
社会心理学やコミュニケーション研究を支援するデータを提供します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98