🚀 roberta-es-clinical-trials-temporal-ner
該命名實體識別模型可根據 TimeML 方案 (Pustejovsky et al. 2005) 檢測時間表達式(TIMEX),此外還能識別年齡實體:
- 年齡:例如 18 años
- 日期:例如 2022、26 de noviembre
- 持續時間:例如 3 horas
- 頻率:例如 semanal
- 時間:例如 noche
該模型在測試集上取得了以下結果(使用訓練集和開發集進行訓練;結果是 5 輪評估的平均值):
- 精確率:0.900(±0.011)
- 召回率:0.900(±0.009)
- F1 值:0.900(±0.007)
- 準確率:0.996(±0.001)
✨ 主要特性
📚 模型描述
此模型對預訓練模型 bsc-bio-ehr-es 進行了調整,該預訓練模型在 Pio Carriño et al. (2022) 中有所介紹。它經過微調,可對西班牙語的臨床試驗文本進行時間命名實體識別。該模型在 CT - EBM - ES 語料庫(Campillos - Llanos et al. 2021) 上進行了微調。
如果您使用此模型,請按以下方式引用:
@article{campillosetal2024,
title = {{Hybrid tool for semantic annotation and concept extraction of medical texts in Spanish}},
author = {Campillos-Llanos, Leonardo and Valverde-Mateos, Ana and Capllonch-Carri{\'o}n, Adri{\'a}n},
journal = {BMC Bioinformatics},
year={2024},
publisher={BioMed Central}
}
🎯 預期用途與侷限性
披露:此模型正在開發中,需要進一步改進。在沒有人工協助和監督的情況下,不應將其用於醫療決策
該模型具有通用目的,但可能存在偏差和/或其他不良偏差。
使用這些模型(或基於這些模型的系統)部署或提供系統和/或服務的第三方應注意,減輕使用這些模型帶來的風險是他們的責任。無論如何,第三方都需要遵守適用的法規,包括有關人工智能使用的法規。
模型的所有者或創建者在任何情況下都不對第三方使用這些模型產生的任何結果負責。
免責聲明:此工具正在開發中,不應用於醫療決策
該模型的用途是通用的,並且可能存在偏差和/或其他不良偏差。
使用這些模型(或基於這些模型的系統)部署或提供系統和/或服務的第三方應注意,減輕使用這些模型帶來的風險是他們的責任。無論如何,第三方都需要遵守適用的法規,包括有關人工智能使用的法規。
模型的所有者或創建者在任何情況下都不對第三方使用這些模型產生的任何結果負責。
📊 訓練和評估數據
用於微調的數據是 西班牙語循證醫學臨床試驗語料庫。它是一個包含 1200 篇關於臨床試驗研究和臨床試驗公告的文本集合:
- 500 篇來自以知識共享許可發佈的期刊摘要,例如可在 PubMed 或科學電子圖書館在線(SciELO)上獲取的摘要
- 700 篇在歐洲臨床試驗註冊中心和西班牙臨床試驗存儲庫上發佈的臨床試驗公告
如果您使用 CT - EBM - ES 資源,請按以下方式引用:
@article{campillosetal-midm2021,
title = {A clinical trials corpus annotated with UMLS© entities to enhance the access to Evidence-Based Medicine},
author = {Campillos-Llanos, Leonardo and Valverde-Mateos, Ana and Capllonch-Carri{\'o}n, Adri{\'a}n and Moreno-Sandoval, Antonio},
journal = {BMC Medical Informatics and Decision Making},
volume={21},
number={1},
pages={1--19},
year={2021},
publisher={BioMed Central}
}
🔧 訓練過程
訓練超參數
訓練期間使用了以下超參數:
- 學習率:2e - 05
- 訓練批次大小:16
- 評估批次大小:16
- 種子:我們在 5 輪評估中使用了不同的種子,並上傳了結果最佳的模型
- 優化器:Adam,β=(0.9, 0.999),ε = 1e - 08
- 學習率調度器類型:線性
- 訓練輪數:平均 14 輪(±2.24)
訓練結果(測試集;5 輪不同種子的平均值和標準差)
精確率 |
召回率 |
F1 值 |
準確率 |
0.900(±0.011) |
0.900(±0.009) |
0.900(±0.007) |
0.996(±0.001) |
各類別的結果(測試集;5 輪不同種子的平均值和標準差)
類別 |
精確率 |
召回率 |
F1 值 |
支持度 |
年齡 |
0.926(±0.013) |
0.947(±0.009) |
0.936(±0.010) |
372 |
日期 |
0.931(±0.015) |
0.895(±0.014) |
0.913(±0.013) |
412 |
持續時間 |
0.918(±0.014) |
0.893(±0.019) |
0.905(±0.010) |
629 |
頻率 |
0.780(±0.043) |
0.885(±0.008) |
0.829(±0.024) |
73 |
時間 |
0.722(±0.068) |
0.809(±0.042) |
0.762(±0.052) |
113 |
框架版本
- Transformers 4.17.0
- Pytorch 1.10.2+cu113
- Datasets 1.18.4
- Tokenizers 0.11.6
📄 許可證
本項目採用 CC - BY - NC - 4.0 許可證。