🚀 釣魚郵件檢測BERT模型 - PhishMail
本倉庫提供了一個經過微調的BERT模型,專門用於檢測釣魚郵件。該模型通過分析郵件正文文本,將郵件分類為釣魚郵件或正常郵件。
🚀 快速開始
安裝依賴
使用以下命令安裝所有必需的庫:
!pip install transformers torch
加載模型
from transformers import BertForSequenceClassification, BertTokenizer
import torch
model_name = 'jagan-raj/PhishMail'
model = BertForSequenceClassification.from_pretrained(model_name)
tokenizer = BertTokenizer.from_pretrained(model_name)
model.eval()
使用模型進行預測
email_text = "Your email content here"
inputs = tokenizer(
email_text,
return_tensors="pt",
truncation=True,
padding='max_length'
)
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predictions = torch.argmax(logits, dim=-1)
result = "This is a phishing email." if predictions.item() == 1 else "This is a legitimate email."
print(f"Prediction: {result}")
✨ 主要特性
- 強大的架構:基於BERT(雙向編碼器表徵)架構,能夠進行雙向上下文理解,有效捕捉郵件文本中的語義信息。
- 精準分類:經過精心微調,可準確地將郵件分類為釣魚郵件或正常郵件,為郵件安全提供有力保障。
- 數據多樣性:在包含釣魚郵件和正常郵件的精心策劃數據集上進行微調,確保模型能夠適應各種郵件內容和結構。
📦 安裝指南
使用以下命令安裝所有必需的庫:
!pip install transformers torch
💻 使用示例
基礎用法
email_text = "Your email content here"
inputs = tokenizer(
email_text,
return_tensors="pt",
truncation=True,
padding='max_length'
)
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predictions = torch.argmax(logits, dim=-1)
result = "This is a phishing email." if predictions.item() == 1 else "This is a legitimate email."
print(f"Prediction: {result}")
📚 詳細文檔
模型詳情
屬性 |
詳情 |
模型類型 |
BERT(雙向編碼器表徵) |
任務 |
釣魚檢測(二分類:釣魚郵件 vs 正常郵件) |
微調 |
在精心策劃的包含釣魚郵件和正常郵件的數據集上進行微調,確保郵件內容和結構的多樣性。 |
目標 |
通過對郵件正文文本的上下文理解,準確識別釣魚嘗試,增強郵件安全性。 |
開發者 |
Jagan Raj |
模型類型 |
google-bert/bert-base-uncased |
許可證 |
免費使用 |
數據集 |
zefang-liu/phishing-email-dataset |
評估
TrainOutput(global_step=6297, training_loss=0.07093968526965307, metrics={'train_runtime': 5545.442, 'train_samples_per_second': 9.08, 'train_steps_per_second': 1.136, 'total_flos': 1.32489571926528e+16, 'train_loss': 0.07093968526965307, 'epoch': 3.0})
模型總結
這個經過微調的BERT模型旨在檢測釣魚郵件。它基於強大的BERT(雙向編碼器表徵)架構,進行二分類,將郵件標記為釣魚郵件或正常郵件。
該模型在包含釣魚郵件和正常郵件的數據集上進行了微調,確保能夠理解釣魚內容中常見的模式和語言線索。通過利用上下文理解,它可以識別文本中的細微差異,從而區分惡意意圖和正常通信。這使其成為郵件安全和反釣魚防禦的有效工具。
📄 許可證
本模型免費供所有人使用。
作者 - Jagan Raj
LinkedIn鏈接