B

Biomednlp KRISSBERT PubMed UMLS EL

microsoftによって開発
KRISSBERTは知識強化型自己教師あり学習に基づく生物医学エンティティリンキングモデルで、アノテーションのないテキストとドメイン知識を活用してコンテキストエンコーダーを訓練し、エンティティ名の多様なバリエーションと曖昧性の問題を効果的に解決します。
ダウンロード数 4,643
リリース時間 : 4/15/2022

モデル概要

KRISSBERTは生物医学分野に特化したエンティティリンキングモデルで、コンテキストを理解し、規範的なエンティティID(UMLSのCUIなど)に正確にリンクすることができ、従来の方法では処理できなかった未知のエンティティやコンテキスト理解の欠如の問題を解決します。

モデル特徴

知識強化型自己教師あり学習
UMLSオントロジーの生物医学エンティティ名とPubMedの抄録を利用した自己教師あり事前学習を行い、ゴールドスタンダードのエンティティ言及例や全てのエンティティの規範的な記述を必要としません。
コンテキスト理解
エンティティ言及のコンテキストを理解し、曖昧性を解消して規範的なエンティティIDに正確にリンクでき、単なる表面形式の予測にとどまりません。
高性能
7つの標準的な生物医学エンティティリンキングデータセットで最先端の性能を達成し、従来の自己教師あり手法と比較して最大20ポイントの精度向上を実現しました。

モデル能力

生物医学エンティティリンキング
コンテキスト理解
エンティティ曖昧性解消

使用事例

生物医学研究
医学文献エンティティリンキング
医学文献中のエンティティ言及をUMLSの規範的なエンティティIDにリンクします。例えば、文脈に応じて「ER」を「救急室」または「エストロゲン受容体遺伝子」にリンクします。
MedMentionsデータセットで約58.3%のTop-1精度を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase