D

Deid Roberta I2b2

obiによって開発
このモデルはRoBERTaをファインチューニングしたシーケンスラベリングモデルで、医療記録内の保護対象健康情報(PHI/PII)を識別・除去します。
ダウンロード数 1.1M
リリース時間 : 3/2/2022

モデル概要

このモデルは電子健康記録(EHR)の非識別化処理専用に設計されており、日付、医療従事者、病院、年齢などHIPAAで定義された11種類の保護対象健康情報エンティティを識別・分類できます。

モデル特徴

HIPAA準拠
HIPAA法規定義の11カテゴリPHI識別基準に厳密に準拠
コンテキスト認識
各文に前後32トークンのコンテキスト情報を追加し、認識精度を向上
BILOUラベリング
BILOUラベリングスキーム採用によりトークンレベル予測を完全なエンティティセグメントに集約

モデル能力

医療テキスト分析
機微情報識別
エンティティ分類
テキスト非識別化

使用事例

医療データプライバシー保護
電子健康記録匿名化
医療記録共有前に患者個人情報を自動除去
F1値が業界標準を達成
臨床研究データ準備
研究目的向けに非識別化された患者データを準備
臨床的価値を保持しつつ患者プライバシーを保護
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase