🚀 通用数据保护条例(GDPR)隐私政策命名实体识别模型
本项目提供了一个基于Transformer的命名实体识别(NER)模型,用于识别通用数据保护条例(GDPR)相关的隐私政策中的实体。该模型能够帮助用户更好地理解和处理隐私政策中的关键信息。
🚀 快速开始
安装依赖
确保你已经安装了transformers
库:
pip install transformers
示例代码
from transformers import pipeline
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("PaDaS-Lab/gdpr-privacy-policy-ner", use_auth_token="AUTH_TOKEN")
model = AutoModelForTokenClassification.from_pretrained("PaDaS-Lab/gdpr-privacy-policy-ner", use_auth_token="AUTH_TOKEN")
ner = pipeline("ner", model=model, tokenizer=tokenizer)
example = "We do not knowingly collect personal information from anyone under 16. We may limit how we collect, use and store some of the information of EU or EEA users between ages 13 and 16."
results = ner(example)
print(results)
💻 使用示例
基础用法
上述示例代码展示了如何使用该模型进行命名实体识别。你只需要提供一个文本示例,模型就会返回识别出的实体信息。
高级用法
你可以根据自己的需求调整模型的参数,例如使用不同的预训练模型或调整pipeline
的配置。
📚 详细文档
实体类别
以下是根据GDPR定义的33种命名实体识别(NER)标注:
缩写 |
类别 |
DC |
数据控制者 |
DP |
数据处理者 |
DPO |
数据保护官 |
R |
接收者 |
TP |
第三方 |
A |
监管机构 |
DS |
数据主体 |
DSO |
数据源 |
RP |
必要目的 |
NRP |
非必要目的 |
P |
处理 |
NPD |
非个人数据 |
PD |
个人数据 |
OM |
组织措施 |
TM |
技术措施 |
LB |
法律依据 |
CONS |
同意 |
CONT |
合同 |
LI |
合法利益 |
ADM |
自动化决策 |
RET |
保留 |
SEU |
欧盟范围 |
SNEU |
非欧盟范围 |
RI |
权利 |
DSR15 |
第15条 - 数据主体的访问权 |
DSR16 |
第16条 - 更正权 |
DSR17 |
第17条 - 删除权(“被遗忘权”) |
DSR18 |
第18条 - 限制处理权 |
DSR19 |
第19条 - 关于个人数据更正、删除或限制处理的通知义务 |
DSR20 |
第20条 - 数据可移植权 |
DSR21 |
第21条 - 反对权 |
DSR22 |
第22条 - 自动化个体决策,包括画像分析 |
LC |
提出投诉 |
性能表现

📄 许可证
本项目采用MIT许可证。
⚠️ 重要提示
我们不会故意收集16岁以下任何人的个人信息。我们可能会限制对欧盟或欧洲经济区13至16岁用户部分信息的收集、使用和存储方式。