開源finetuned-bert釣魚網站分類模型 - 文本輸入即時預測網站安全狀況

首頁

Finetuned Bert Phishing Site Classification

由shogun-the-great開發

該模型是基於BERT-Base-Uncased微調的釣魚網站分類模型，可根據文本輸入預測網站屬於'安全'或'不安全'類別。

文本分類

Transformers

#釣魚檢測 #BERT微調 #網站安全

下載量 21

發布時間 : 1/15/2025

模型概述

一個二分類模型，專門用於檢測釣魚網站文本內容，區分安全和不安全網站。

模型特點

基於BERT微調

利用BERT強大的語言理解能力進行釣魚網站檢測

二分類能力

可將網站內容準確分類為安全或不安全兩類

英語文本支持

專門針對英語網站內容優化

模型能力

文本分類

釣魚檢測

網站安全評估

使用案例

網絡安全

瀏覽器擴展集成

集成到瀏覽器擴展中實現即時網站分類

幫助用戶識別潛在釣魚網站

文本數據分析

分析文本數據中的釣魚特徵指標

識別可疑網站內容模式

🚀 用於釣魚網站分類的微調BERT-Base-Uncased模型卡片

本模型基於BERT架構，針對釣魚網站分類任務進行了微調。它能夠根據文本輸入，準確判斷網站是否安全，為網絡安全提供有力支持。

🚀 快速開始

你可以直接從Hugging Face Hub加載微調後的模型：

from transformers import AutoTokenizer, AutoModelForSequenceClassification

# 從Hugging Face Hub加載分詞器和模型
model_name = "shogun-the-great/finetuned-bert-phishing-site-classification"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 示例用法
text = "Enter your login credentials to claim a free reward!"
inputs = tokenizer(text, return_tensors="pt", truncation=True)
outputs = model(**inputs)

# 獲取預測標籤
logits = outputs.logits
prediction = logits.argmax(dim=-1).item()
print("Prediction:", "Not Safe" if prediction == 1 else "Safe")

✨ 主要特性

精準分類：能夠準確地將網站分為“安全”和“不安全”兩類，有效識別釣魚網站。
易於集成：可與瀏覽器擴展集成，實現即時網站分類。
可擴展性：用戶可以針對特定的二分類任務或相似領域的數據集進一步微調模型。

📦 安裝指南

暫未提及具體安裝命令，跳過此章節。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification

# 從Hugging Face Hub加載分詞器和模型
model_name = "shogun-the-great/finetuned-bert-phishing-site-classification"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 示例用法
text = "Enter your login credentials to claim a free reward!"
inputs = tokenizer(text, return_tensors="pt", truncation=True)
outputs = model(**inputs)

# 獲取預測標籤
logits = outputs.logits
prediction = logits.argmax(dim=-1).item()
print("Prediction:", "Not Safe" if prediction == 1 else "Safe")

高級用法

# 可根據實際需求，將該模型與其他安全措施結合使用，以實現更強大的釣魚檢測功能。
# 例如，結合瀏覽器擴展，在用戶訪問網站時即時進行分類。
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_name = "shogun-the-great/finetuned-bert-phishing-site-classification"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 模擬瀏覽器擴展獲取的即時文本
real_time_text = get_real_time_text_from_browser()  

inputs = tokenizer(real_time_text, return_tensors="pt", truncation=True)
outputs = model(**inputs)

logits = outputs.logits
prediction = logits.argmax(dim=-1).item()
print("Real-time Prediction:", "Not Safe" if prediction == 1 else "Safe")