D

Deid Roberta I2b2

Developed by obi
该模型是基于RoBERTa微调的序列标注模型,用于识别和移除医疗记录中的受保护健康信息(PHI/PII)。
Downloads 1.1M
Release Time : 3/2/2022

Model Overview

该模型专门用于电子健康档案(EHR)的去标识化处理,能够识别并分类11种HIPAA定义的受保护健康信息实体,包括日期、医护人员、医院、年龄等。

Model Features

HIPAA合规
严格遵循HIPAA法规定义的11类PHI识别标准
上下文感知
每个句子添加前后32个标记的上下文信息,提高识别准确率
BILOU标注
采用BILOU标注方案将标记级预测聚合为完整实体片段

Model Capabilities

医疗文本分析
敏感信息识别
实体分类
文本去标识化

Use Cases

医疗数据隐私保护
电子健康档案匿名化
在共享医疗记录前自动移除患者个人信息
F1值达到行业标准
临床研究数据准备
为研究目的准备去标识化的患者数据
保留临床价值同时保护患者隐私
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase