L

Llama Ai4privacy Multilingual Anonymiser Openpii

由 ai4privacy 开发
基于ModernBERT架构的多语言PII匿名化模型,支持8种语言的个人身份信息识别与脱敏
下载量 127
发布时间 : 3/23/2025

模型简介

该模型专门用于识别和匿名化文本中的个人身份信息(PII),支持多种PII类型和语言,适用于隐私保护场景

模型特点

多语言支持
支持8种语言的PII识别,包括欧洲和亚洲主要语言
高精度识别
在测试集上整体F1分数达到98.59%,多数PII类型识别准确率超过99%
广泛PII覆盖
支持21种PII标签识别,包括姓名、证件号、联系方式等多种敏感信息
零假阳性
多数PII类型识别假阳性率为0,确保非PII内容不会被错误标记

模型能力

文本中的PII识别
多语言PII检测
敏感信息匿名化
隐私数据保护

使用案例

数据隐私保护
用户数据匿名化处理
在存储或共享用户数据前自动识别并匿名化PII信息
可有效降低数据泄露风险,符合GDPR等隐私法规要求
日志脱敏
对系统日志中的敏感信息进行自动脱敏处理
保护日志中的用户隐私同时保留日志分析价值
合规性检查
隐私合规审计
自动检测文档和数据库中可能存在的PII信息
帮助组织识别隐私合规风险点
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase