D

Deid Roberta I2b2

由obi開發
該模型是基於RoBERTa微調的序列標註模型,用於識別和移除醫療記錄中的受保護健康信息(PHI/PII)。
下載量 1.1M
發布時間 : 3/2/2022

模型概述

該模型專門用於電子健康檔案(EHR)的去標識化處理,能夠識別並分類11種HIPAA定義的受保護健康信息實體,包括日期、醫護人員、醫院、年齡等。

模型特點

HIPAA合規
嚴格遵循HIPAA法規定義的11類PHI識別標準
上下文感知
每個句子添加前後32個標記的上下文信息,提高識別準確率
BILOU標註
採用BILOU標註方案將標記級預測聚合為完整實體片段

模型能力

醫療文本分析
敏感信息識別
實體分類
文本去標識化

使用案例

醫療數據隱私保護
電子健康檔案匿名化
在共享醫療記錄前自動移除患者個人信息
F1值達到行業標準
臨床研究數據準備
為研究目的準備去標識化的患者數據
保留臨床價值同時保護患者隱私
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase