K

Kcelectra Base Bad Sentence Classifier

由JminJ開發
基於ELECTRA架構的韓語文本分類模型,用於判斷評論和聊天內容是否包含敏感信息
下載量 46
發布時間 : 4/7/2022

模型概述

該模型通過微調ELECTRA模型實現,專門用於檢測韓語文本中的不良內容(如敏感信息、仇恨言論等)。模型基於公開數據集訓練,但訓練數據因版權問題未公開。

模型特點

多數據集融合訓練
整合Korean Unsmile和Korean HateSpeech兩個數據集,並重新標記為二分類形式
特定敏感詞處理
對包含特定韓語敏感詞(如'~노'、'좆'等)的語句進行特殊標記處理
多模型對比
使用三種不同的韓語ELECTRA模型進行訓練和性能比較

模型能力

韓語文本分類
敏感內容檢測
仇恨言論識別

使用案例

內容審核
社交媒體評論過濾
自動識別並過濾社交媒體上的不良評論
準確率達88.49%(基於kcElectra_base模型)
聊天內容監控
即時監控聊天應用中的不當言論
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase