🚀 通用數據保護條例(GDPR)隱私政策命名實體識別模型
本項目提供了一個基於Transformer的命名實體識別(NER)模型,用於識別通用數據保護條例(GDPR)相關的隱私政策中的實體。該模型能夠幫助用戶更好地理解和處理隱私政策中的關鍵信息。
🚀 快速開始
安裝依賴
確保你已經安裝了transformers
庫:
pip install transformers
示例代碼
from transformers import pipeline
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("PaDaS-Lab/gdpr-privacy-policy-ner", use_auth_token="AUTH_TOKEN")
model = AutoModelForTokenClassification.from_pretrained("PaDaS-Lab/gdpr-privacy-policy-ner", use_auth_token="AUTH_TOKEN")
ner = pipeline("ner", model=model, tokenizer=tokenizer)
example = "We do not knowingly collect personal information from anyone under 16. We may limit how we collect, use and store some of the information of EU or EEA users between ages 13 and 16."
results = ner(example)
print(results)
💻 使用示例
基礎用法
上述示例代碼展示瞭如何使用該模型進行命名實體識別。你只需要提供一個文本示例,模型就會返回識別出的實體信息。
高級用法
你可以根據自己的需求調整模型的參數,例如使用不同的預訓練模型或調整pipeline
的配置。
📚 詳細文檔
實體類別
以下是根據GDPR定義的33種命名實體識別(NER)標註:
縮寫 |
類別 |
DC |
數據控制者 |
DP |
數據處理者 |
DPO |
數據保護官 |
R |
接收者 |
TP |
第三方 |
A |
監管機構 |
DS |
數據主體 |
DSO |
數據源 |
RP |
必要目的 |
NRP |
非必要目的 |
P |
處理 |
NPD |
非個人數據 |
PD |
個人數據 |
OM |
組織措施 |
TM |
技術措施 |
LB |
法律依據 |
CONS |
同意 |
CONT |
合同 |
LI |
合法利益 |
ADM |
自動化決策 |
RET |
保留 |
SEU |
歐盟範圍 |
SNEU |
非歐盟範圍 |
RI |
權利 |
DSR15 |
第15條 - 數據主體的訪問權 |
DSR16 |
第16條 - 更正權 |
DSR17 |
第17條 - 刪除權(“被遺忘權”) |
DSR18 |
第18條 - 限制處理權 |
DSR19 |
第19條 - 關於個人數據更正、刪除或限制處理的通知義務 |
DSR20 |
第20條 - 數據可移植權 |
DSR21 |
第21條 - 反對權 |
DSR22 |
第22條 - 自動化個體決策,包括畫像分析 |
LC |
提出投訴 |
性能表現

📄 許可證
本項目採用MIT許可證。
⚠️ 重要提示
我們不會故意收集16歲以下任何人的個人信息。我們可能會限制對歐盟或歐洲經濟區13至16歲用戶部分信息的收集、使用和存儲方式。