D

Distilbert Finetuned Ai4privacy V2

Isotonicによって開発
distilbert-base-uncasedをファインチューニングしたPII(個人識別情報)識別モデルで、テキストから機密情報を検出・除去する
ダウンロード数 3,499
リリース時間 : 11/20/2023

モデル概要

世界最大のオープンソースプライバシーデータセットでファインチューニングされ、54種類の機密情報を識別可能。AIアシスタントやLLMシナリオでのプライバシー保護に適している

モデル特徴

広範なPII識別能力
金融情報、身分証明、連絡先など54種類の機密データタイプを識別可能
効率的な軽量モデル
DistilBERTアーキテクチャを採用し、高精度を維持しながら計算リソース要件を低減
多様なシナリオへの適用性
229の議論トピックと5種類のインタラクションスタイルをカバーするトレーニングデータで、様々なテキストシナリオに適用可能

モデル能力

テキスト内の機密情報検出
個人識別情報認識
プライバシーデータ分類
多カテゴリエンティティ認識

使用事例

プライバシー保護
AIチャット記録のマスキング
チャット記録内の機密情報を自動識別・マスキング
F1スコア0.9549達成
ドキュメントプライバシー審査
GDPRなどのプライバシー規制に準拠するため、ドキュメント内の個人識別情報をスキャン
メールアドレス識別F1スコア1.0
データセキュリティ
ログ匿名化処理
システムログ内の機密データを自動削除
IPアドレス識別F1スコア0.4349
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase