D

Distilbert Finetuned Ai4privacy V2

由Isotonic開發
基於distilbert-base-uncased微調的PII(個人身份信息)識別模型,用於從文本中檢測和移除敏感信息
下載量 3,499
發布時間 : 11/20/2023

模型概述

該模型在全球最大的開源隱私數據集上微調,能夠識別54類敏感信息,適用於AI助手和LLM場景下的隱私保護

模型特點

廣泛的PII識別能力
支持識別54種敏感數據類型,包括金融信息、身份標識、聯繫方式等
高效輕量級模型
基於DistilBERT架構,在保持高準確率的同時減少計算資源需求
多場景適用性
訓練數據涵蓋229個討論主題和5種交互風格,適用於多種文本場景

模型能力

文本中的敏感信息檢測
個人身份信息識別
隱私數據分類
多類別實體識別

使用案例

隱私保護
AI聊天記錄脫敏
自動識別並屏蔽聊天記錄中的敏感信息
F1分數達0.9549
文檔隱私審查
掃描文檔中的個人身份信息以符合GDPR等隱私法規
電子郵件識別F1分數1.0
數據安全
日誌匿名化處理
自動移除系統日誌中的敏感數據
IP地址識別F1分數0.4349
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase