K

Kcelectra Base Bad Sentence Classifier

JminJによって開発
ELECTRAアーキテクチャに基づく韓国語テキスト分類モデル。コメントやチャット内容にセンシティブな情報が含まれているかどうかを判断するために使用されます
ダウンロード数 46
リリース時間 : 4/7/2022

モデル概要

このモデルはELECTRAモデルをファインチューニングして実装され、韓国語テキスト内の不適切な内容(センシティブな情報、ヘイトスピーチなど)を検出するために特別に設計されています。モデルは公開データセットでトレーニングされていますが、トレーニングデータは著作権の問題により公開されていません。

モデル特徴

複数データセット統合トレーニング
Korean UnsmileとKorean HateSpeechの2つのデータセットを統合し、二値分類形式で再ラベル付けしました
特定のセンシティブワード処理
特定の韓国語センシティブワード(例:'~노'、'좆'など)を含む文に特別なマーキング処理を施しています
複数モデル比較
3つの異なる韓国語ELECTRAモデルを使用してトレーニングと性能比較を行いました

モデル能力

韓国語テキスト分類
センシティブコンテンツ検出
ヘイトスピーチ識別

使用事例

コンテンツ審査
ソーシャルメディアコメントフィルタリング
ソーシャルメディア上の不適切なコメントを自動的に識別しフィルタリングします
精度88.49%(kcElectra_baseモデルベース)
チャット内容監視
チャットアプリ内の不適切な発言をリアルタイムで監視します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase