P

Pii Entity Extractor

AI-Enthusiast11によって開発
DeBERTaをファインチューニングした固有表現認識モデルで、テキスト内の個人識別情報(PII)(氏名、社会保障番号、電話番号などの機密情報)を検出するために特別に設計されています。
ダウンロード数 155
リリース時間 : 4/25/2025

モデル概要

このモデルはトークンレベルの分類による系列ラベリングを行い、テキスト内の様々な個人識別情報エンティティを正確に識別できます。プライバシー保護やデータマスキングのシナリオに適しています。

モデル特徴

高精度PII検出
テストデータでF1値0.95以上を達成し、複数のPIIタイプを正確に識別可能
多カテゴリエンティティ認識
氏名、社会保障番号、電話番号、クレジットカード番号、住所など7種類のPII検出をサポート
サブワード統合処理
組み込みの後処理ロジックにより分割されたサブワードトークンを自動統合

モデル能力

テキスト内の機密情報検出
固有表現認識
データマスキング処理
プライバシー保護

使用事例

プライバシー保護
文書マスキング
文書内の機密情報を自動識別して置換
自動化データマスキングプロセスの実現
コンプライアンス審査
プライバシー規制に違反する可能性のあるテキスト内容を検出
GDPRなどのコンプライアンス要件を満たす支援
データセキュリティ
ログクリーニング
ログ保存前に機密情報を削除
データ漏洩リスクの低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase