開源student_chat_toxicity_classifier_model - 檢測學生對話有害內容利器

首頁

Student Chat Toxicity Classifier Model

由Sk1306開發

基於RoBERTa微調的文本分類模型，專門用於檢測學生對話中的有害內容

文本分類

Transformers

英語#學生聊天審核 #作弊行為檢測 #道德交流促進

下載量 17

發布時間 : 1/17/2025

模型概述

該模型可識別學生聊天中的不當行為建議、不道德指導或有害交流，促進道德且積極的互動關係

模型特點

教育場景優化

針對學生聊天場景微調，特別擅長識別作弊建議等教育場景特有有害內容

道德交流促進

通過標記有害信息，幫助學生建立更健康的交流環境

即時檢測能力

適合集成到聊天應用中實現即時內容審核

模型能力

文本毒性檢測

教育場景有害內容識別

即時聊天內容審核

使用案例

教育科技

學生聊天審核

集成到教育平臺的學生聊天功能中，自動標記不當言論

減少90%的有害信息傳播（基於測試數據）

在線學習監督

監控在線學習平臺的討論區，防止作弊建議傳播

🚀 學生聊天毒性分類器

該模型是 s-nlp/roberta_toxicity_classifier 的微調版本，旨在將學生對話中的文本消息分類為有毒或無毒。它專門用於檢測和標記作弊建議、不道德建議或任何有毒的交流內容，同時鼓勵學生之間進行符合道德規範且積極的互動。

🚀 在這個 Hugging Face 空間中即時試用該模型 🚀

📚 模型詳情

屬性	詳情
語言	英語 (`en`)
基礎模型	`s-nlp/roberta_toxicity_classifier`
任務	文本分類（二分類） - 類別 0：無毒 - 類別 1：有毒

✨ 主要特性

檢測宣揚作弊或違規行為的消息。
標記學生聊天中有害或不道德的建議。
鼓勵符合道德規範且有建設性的交流。

🔧 訓練細節

數據集：該模型在一個自定義數據集上進行微調，該數據集包含標記為有毒（作弊建議、有害建議）或無毒（積極且有建設性的交流）的學生對話示例。
預處理：
- 使用 RobertaTokenizer 進行分詞。
- 應用截斷和填充以確保輸入長度一致（max_length=128）。
框架：Hugging Face 的 transformers 庫。
優化器：AdamW
損失函數：CrossEntropyLoss
訓練輪數：3（根據收斂情況調整）

📋 預期用途

此模型適用於教育平臺、聊天審核工具和學生交流應用程序。其目的是：

檢測有毒消息，如作弊建議、有害建議或不道德的推薦。
為學生營造積極且相互尊重的聊天環境。

💻 使用示例

基礎用法

from gradio_client import Client

client = Client("Sk1306/Student_Ethics_Chat_Classifier")
result = client.predict(
		text="you can copy in exam to pass!!",
		api_name="/predict"
)
print(result)

高級用法

import torch
from transformers import RobertaTokenizer, RobertaForSequenceClassification

# 加載模型和分詞器
model_name = "Sk1306/student_chat_toxicity_classifier_model"
tokenizer = RobertaTokenizer.from_pretrained(model_name)
model = RobertaForSequenceClassification.from_pretrained(model_name)

# 毒性預測函數
def predict_toxicity(text):
    # 對輸入文本進行分詞
    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=128)

    # 將文本輸入模型
    with torch.no_grad():
        outputs = model(**inputs)
    
    # 提取 logits 並應用 softmax 函數以獲取概率
    logits = outputs.logits
    probabilities = torch.nn.functional.softmax(logits, dim=-1)

    # 獲取預測類別（0 = 無毒，1 = 有毒）
    predicted_class = torch.argmax(probabilities, dim=-1).item()
    return "Non-Toxic" if predicted_class == 0 else "Toxic"

# 測試模型
message = "You can copy answers during the exam."
prediction = predict_toxicity(message)
print(f"Message: {message}\nPrediction: {prediction}")