🚀 roberta-es-clinical-trials-temporal-ner
该命名实体识别模型可根据 TimeML 方案 (Pustejovsky et al. 2005) 检测时间表达式(TIMEX),此外还能识别年龄实体:
- 年龄:例如 18 años
- 日期:例如 2022、26 de noviembre
- 持续时间:例如 3 horas
- 频率:例如 semanal
- 时间:例如 noche
该模型在测试集上取得了以下结果(使用训练集和开发集进行训练;结果是 5 轮评估的平均值):
- 精确率:0.900(±0.011)
- 召回率:0.900(±0.009)
- F1 值:0.900(±0.007)
- 准确率:0.996(±0.001)
✨ 主要特性
📚 模型描述
此模型对预训练模型 bsc-bio-ehr-es 进行了调整,该预训练模型在 Pio Carriño et al. (2022) 中有所介绍。它经过微调,可对西班牙语的临床试验文本进行时间命名实体识别。该模型在 CT - EBM - ES 语料库(Campillos - Llanos et al. 2021) 上进行了微调。
如果您使用此模型,请按以下方式引用:
@article{campillosetal2024,
title = {{Hybrid tool for semantic annotation and concept extraction of medical texts in Spanish}},
author = {Campillos-Llanos, Leonardo and Valverde-Mateos, Ana and Capllonch-Carri{\'o}n, Adri{\'a}n},
journal = {BMC Bioinformatics},
year={2024},
publisher={BioMed Central}
}
🎯 预期用途与局限性
披露:此模型正在开发中,需要进一步改进。在没有人工协助和监督的情况下,不应将其用于医疗决策
该模型具有通用目的,但可能存在偏差和/或其他不良偏差。
使用这些模型(或基于这些模型的系统)部署或提供系统和/或服务的第三方应注意,减轻使用这些模型带来的风险是他们的责任。无论如何,第三方都需要遵守适用的法规,包括有关人工智能使用的法规。
模型的所有者或创建者在任何情况下都不对第三方使用这些模型产生的任何结果负责。
免责声明:此工具正在开发中,不应用于医疗决策
该模型的用途是通用的,并且可能存在偏差和/或其他不良偏差。
使用这些模型(或基于这些模型的系统)部署或提供系统和/或服务的第三方应注意,减轻使用这些模型带来的风险是他们的责任。无论如何,第三方都需要遵守适用的法规,包括有关人工智能使用的法规。
模型的所有者或创建者在任何情况下都不对第三方使用这些模型产生的任何结果负责。
📊 训练和评估数据
用于微调的数据是 西班牙语循证医学临床试验语料库。它是一个包含 1200 篇关于临床试验研究和临床试验公告的文本集合:
- 500 篇来自以知识共享许可发布的期刊摘要,例如可在 PubMed 或科学电子图书馆在线(SciELO)上获取的摘要
- 700 篇在欧洲临床试验注册中心和西班牙临床试验存储库上发布的临床试验公告
如果您使用 CT - EBM - ES 资源,请按以下方式引用:
@article{campillosetal-midm2021,
title = {A clinical trials corpus annotated with UMLS© entities to enhance the access to Evidence-Based Medicine},
author = {Campillos-Llanos, Leonardo and Valverde-Mateos, Ana and Capllonch-Carri{\'o}n, Adri{\'a}n and Moreno-Sandoval, Antonio},
journal = {BMC Medical Informatics and Decision Making},
volume={21},
number={1},
pages={1--19},
year={2021},
publisher={BioMed Central}
}
🔧 训练过程
训练超参数
训练期间使用了以下超参数:
- 学习率:2e - 05
- 训练批次大小:16
- 评估批次大小:16
- 种子:我们在 5 轮评估中使用了不同的种子,并上传了结果最佳的模型
- 优化器:Adam,β=(0.9, 0.999),ε = 1e - 08
- 学习率调度器类型:线性
- 训练轮数:平均 14 轮(±2.24)
训练结果(测试集;5 轮不同种子的平均值和标准差)
精确率 |
召回率 |
F1 值 |
准确率 |
0.900(±0.011) |
0.900(±0.009) |
0.900(±0.007) |
0.996(±0.001) |
各类别的结果(测试集;5 轮不同种子的平均值和标准差)
类别 |
精确率 |
召回率 |
F1 值 |
支持度 |
年龄 |
0.926(±0.013) |
0.947(±0.009) |
0.936(±0.010) |
372 |
日期 |
0.931(±0.015) |
0.895(±0.014) |
0.913(±0.013) |
412 |
持续时间 |
0.918(±0.014) |
0.893(±0.019) |
0.905(±0.010) |
629 |
频率 |
0.780(±0.043) |
0.885(±0.008) |
0.829(±0.024) |
73 |
时间 |
0.722(±0.068) |
0.809(±0.042) |
0.762(±0.052) |
113 |
框架版本
- Transformers 4.17.0
- Pytorch 1.10.2+cu113
- Datasets 1.18.4
- Tokenizers 0.11.6
📄 许可证
本项目采用 CC - BY - NC - 4.0 许可证。