D

Distilbert Base Multilingual Cased Pii

由yonigo開發
基於distilbert-base-multilingual-cased微調的多語言PII識別模型,用於識別文本中的個人身份信息。
下載量 531
發布時間 : 6/25/2024

模型概述

該模型在ai4privacy/pii-masking-300k數據集上微調,專門用於識別和分類文本中的個人身份信息(PII),如姓名、地址、電話號碼等。

模型特點

多語言支持
基於多語言DistilBERT模型,支持多種語言的PII識別。
高精度識別
在多個PII類別上表現出高F1值,如Email F1達到0.9833,Ip F1達到0.9842。
輕量級模型
基於DistilBERT架構,相比完整BERT模型更輕量,同時保持較高性能。

模型能力

識別個人身份信息
多語言文本處理
實體分類

使用案例

數據隱私保護
自動PII掩碼
自動識別文本中的個人身份信息並進行掩碼處理,保護用戶隱私。
可準確識別姓名、電話號碼、地址等多種PII類型
合規性檢查
文檔合規性審查
檢查文檔中是否包含需要保護的敏感信息,確保符合隱私法規要求。
高準確率識別多種PII類型,幫助確保合規
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase