B

Biomednlp KRISSBERT PubMed UMLS EL

由microsoft開發
KRISSBERT是一個基於知識增強自監督學習的生物醫學實體鏈接模型,通過利用無標註文本和領域知識訓練上下文編碼器,有效解決實體名稱多樣性變異和歧義性問題。
下載量 4,643
發布時間 : 4/15/2022

模型概述

KRISSBERT是一個專注於生物醫學領域的實體鏈接模型,能夠理解上下文並準確鏈接到規範實體ID(如UMLS中的CUI),解決了傳統方法無法處理未登錄實體和缺乏上下文理解的問題。

模型特點

知識增強自監督學習
利用UMLS本體的生物醫學實體名稱和PubMed摘要進行自監督預訓練,無需金標實體指稱示例和所有實體的規範描述。
上下文理解
能夠理解實體指稱的上下文,準確消歧並鏈接到規範實體ID,而不僅僅是預測表面形式。
高性能
在七個標準生物醫學實體鏈接數據集上實現了最先進性能,準確率較先前自監督方法最高提升20個百分點。

模型能力

生物醫學實體鏈接
上下文理解
實體消歧

使用案例

生物醫學研究
醫學文獻實體鏈接
將醫學文獻中的實體指稱鏈接到UMLS中的規範實體ID,如將"ER"根據上下文鏈接到"急診室"或"雌激素受體基因"。
在MedMentions數據集上達到約58.3%的Top-1準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase