D

Distilbert Base Multilingual Cased Pii

yonigoによって開発
distilbert-base-multilingual-casedをファインチューニングした多言語PII認識モデルで、テキスト中の個人識別情報を識別します。
ダウンロード数 531
リリース時間 : 6/25/2024

モデル概要

このモデルはai4privacy/pii-masking-300kデータセットでファインチューニングされ、テキスト中の氏名、住所、電話番号などの個人識別情報(PII)の識別と分類に特化しています。

モデル特徴

多言語サポート
多言語DistilBERTモデルを基に、複数言語のPII認識をサポートします。
高精度認識
Email F1が0.9833、Ip F1が0.9842など、複数のPIIカテゴリーで高いF1値を示します。
軽量モデル
DistilBERTアーキテクチャを採用し、完全なBERTモデルに比べて軽量でありながら高い性能を維持します。

モデル能力

個人識別情報の認識
多言語テキスト処理
エンティティ分類

使用事例

データプライバシー保護
自動PIIマスキング
テキスト中の個人識別情報を自動認識しマスキング処理を行い、ユーザーのプライバシーを保護します。
氏名、電話番号、住所など様々なPIIタイプを正確に認識可能
コンプライアンスチェック
ドキュメントコンプライアンス審査
保護が必要な機密情報がドキュメントに含まれていないかチェックし、プライバシー規制への準拠を確保します。
高い精度で複数のPIIタイプを認識し、コンプライアンス確保を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase