S

Sapbert From PubMedBERT Fulltext Mean Token

由cambridgeltl開發
基於PubMedBERT的生物醫學實體表徵模型,通過自對齊預訓練優化語義關係捕捉
下載量 244.39k
發布時間 : 3/2/2022

模型概述

SapBERT是基於PubMedBERT架構的生物醫學實體表徵模型,專門針對生物醫學領域的細粒度語義關係進行優化,特別適用於實體鏈接等需要建模同義關係的任務。

模型特點

自對齊預訓練
通過專門設計的度量學習框架,利用UMLS生物醫學本體庫優化實體表徵空間
一體化解決方案
為醫學實體鏈接(MEL)問題提供端到端解決方案,無需複雜的流水線系統
跨語言擴展
具備跨語言擴展能力,相關研究在ACL 2021和NAACL 2021發表

模型能力

生物醫學實體表徵
語義關係建模
實體鏈接
同義詞識別

使用案例

醫學信息處理
醫學實體鏈接
將不同來源的醫學術語鏈接到統一醫學語言系統(UMLS)中的標準概念
在六個MEL基準數據集上實現了最新最優性能
科學文獻分析
分析科學文獻中的生物醫學術語關係
即使沒有任務特定監督,仍能達到最優水平
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase